《五百家播芳大全文粹》服饰内容提取 · 工作日志

时间:2026-05-09

任务:提取《五百家播芳大全文粹》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

```

读取 文总集output/宋文鉴/原文提取.md

读取 文总集output/宋文鉴/总结.md

读取 文总集output/宋文鉴/日志.md

→ 确认三份MD输出格式

```

Step 2: 确认输入文件

```

输入文件路径 /home/z/my-project/upload/文总集/文总集/五百家播芳大全文粹.txt 不存在

→ 从殆知阁GitHub仓库frankslin/daizhigev20的data分支下载

→ 文件格式:.md(非.txt),通过git blob API下载

→ 文件SHA:3e2d8283e1c7ea900092e1ea4a4b6b31d4cc3740

→ 文件大小:2976479 bytes

→ 保存为 /home/z/my-project/upload/文总集/文总集/五百家播芳大全文粹.txt

wc -l → 11936行

mkdir -p 文总集output/五百家播芳大全文粹/ → 创建输出目录

```

Step 3: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(457) 裳(69) 裘(76) 冠(489) 冕(112)
R2袍(34) 褐(9) 裙(0) 衫(22) 襦(22)
R3绶(69) 佩(214) 笏(37) 履(532) 舄(52)
R4帻(6) 弁(15) 铠(1) 甲(121) 兜鍪(0)
R5帛(60) 绢(22) 缟(10) 纱(1) 锦(135)
R6绣(113) 黼(70) 黻(29) 衮(200) 章服(6)
R7带(80) 袂(32) 襟(87) 袖(46) 衽(4)
R8丝(134) 麻(57) 葛(81) 布衣(22) 绵(131)
R9朝服(3) 祭服(0) 丧服(1) 戎服(1) 法服(0)
R10深衣(3) 缁衣(3) 素衣(1) 朱衣(1) 青衣(0)

总匹配行数:约2800行(去重前)

Step 4: 补充搜索与grep -n精确提取

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. 全书11936行,服饰内容以衮衣绣裳、赐衣制度、貂蝉冠饰为核心
  2. 衮衣出现43次,几乎全部为宰辅品秩的固定修辞
  3. 谢赐衣表为独立文体,涵盖赐衣袄、赐衣金带、赐玉带、赐春衣、赐对衣金带金鱼袋银鞍辔马等
  4. "貂蝉出于兜鍪"为全书最精炼的服饰转换意象
  5. 深衣仅3次,但"蝉冕三公府深衣独乐园"为千古名句
  6. 鹤氅3次,王禹偁"披鹤氅衣戴华阳巾"为经典隐逸装束
  7. 欧阳修《昼锦堂记》为全书最完整的服饰论述篇章

Step 5: 噪音过滤

噪音类别

有效服饰段落估计:约90段

Step 6: 保存三份文件


关键发现

  1. 衮衣绣裳为全书最核心的服饰意象:出现约43次,形成"赤舄衮衣→姬旦/裴公"的标准用典模式
  2. 谢赐衣表为独立文体:从赐衣袄到赐玉带到赐对衣金带金鱼袋银鞍辔马,形成完整的宋代赐衣文献体系
  3. 貂蝉出于兜鍪为全书最精炼的服饰转换意象:从武将到宰相的身份转换以服饰变化最为直观
  4. 欧阳修《昼锦堂记》为全书最完整的服饰论述:"衣锦之荣"与"桓圭衮冕不足为贵"
  5. 蝉冕与深衣的对举为经典意象:司马光挽词"蝉冕三公府深衣独乐园"
  6. 弋绨节俭之德反复出现:从帝王赐衣表到考工令箴

关键踩坑记录


文件大小


审核结果

原文均从grep -n提取,有明确行号对应。《五百家播芳大全文粹》为南宋魏齐贤等编宋代诗文总集,服饰内容以衮衣绣裳、赐衣制度为核心,具有鲜明的文体特征和时代特色。已据实整理,未灌水凑字。