《吴都文粹》服饰内容提取 · 工作日志

时间:2026-05-09

任务:提取《吴都文粹》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

```

读取 文总集output/吴都文粹续集/原文提取.md

读取 文总集output/吴都文粹续集/总结.md

读取 文总集output/吴都文粹续集/日志.md

→ 确认三份MD输出格式

```

Step 2: 确认输入文件

```

指定路径 /home/z/my-project/upload/文总集/文总集/吴都文粹.txt 不存在

→ 在 /tmp/daizhige_data/集藏/文总集/ 找到 吴都文粹.md

wc -l → 2260行

mkdir -p 文总集output/吴都文粹/ → 创建输出目录

```

Step 3: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(80) 裳(8) 裘(8) 冠(37) 冕(7)
R2袍(5) 褐(2) 裙(5) 衫(3) 襦(1)
R3绶(6) 佩(19) 笏(1) 履(17) 舄(3)
R4帻(5) 弁(6) 铠(0) 甲(37) 兜鍪(0)
R5帛(10) 绢(0) 缟(1) 纱(4) 锦(26)
R6绣(4) 黼(0) 黻(0) 衮(5) 章服(0)
R7带(27) 袂(4) 襟(17) 袖(5) 衽(1)
R8丝(25) 麻(14) 葛(5) 布衣(4) 绵(8)
R9朝服(1) 祭服(0) 丧服(0) 戎服(0) 法服(0)
R10深衣(0) 缁衣(0) 素衣(0) 朱衣(1) 青衣(0)

总匹配行数:约230行(去重前)

Step 4: 补充搜索与grep -n精确提取

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. 行655王禹偁《昆山县重修文宣王庙记》为全书最集中的服饰文献
  2. 赐紫金鱼袋5例,赐绯鱼袋3例,为碑记署名高频词
  3. 行659、2168"端委"两见,为吴地服饰文明之源
  4. 行907"衣三品服"为直接官服描述
  5. 行979苏舜钦沧浪亭"幅巾以往"为隐逸服饰经典
  6. 衣冠5处均为地域文化意象,非具体服饰描述
  7. 本书规模远小于续集(2260行vs9765行),服饰内容亦较少

Step 5: 噪音过滤

噪音类别

有效服饰段落估计:约25段

Step 6: 保存三份文件


关键发现

  1. 文庙像设为全书最集中的服饰文献:行655被华衮垂珠旒、冠章甫衣缝掖
  2. 官服品秩章绶文献丰富:赐紫金鱼袋5例,衣三品服1例
  3. 衣冠为地域文化核心意象:衣冠之薮、衣冠南避、衣冠之所鳞集
  4. 太伯端委为吴地服饰文明之源:行659、2168两见
  5. 幅巾为隐逸服饰经典:苏舜钦沧浪亭记

关键踩坑记录


文件大小


审核结果

原文均从grep -n提取,有明确行号对应。《吴都文粹》为宋郑虎臣编吴地诗文总集,服饰内容以文庙像设衮冕与官服品秩章绶为核心,与续集相比规模较小、服饰文献较少。已据实整理,未灌水凑字。