《囘文类聚》服饰内容提取 · 工作日志

时间:2026-05-09

任务:提取《囘文类聚》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

```

读取 文总集output/全辽文/原文提取.md

读取 文总集output/全辽文/总结.md

读取 文总集output/全辽文/日志.md

→ 确认三份MD输出格式

```

Step 2: 确认输入文件

```

输入文件路径 /home/z/my-project/upload/文总集/文总集/囘文类聚.txt 不存在

→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/囘文类聚.md

→ 保存为 /home/z/my-project/upload/文总集/文总集/囘文类聚.txt

wc -l → 400行,41KB

```

Step 3: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(9) 裳(1) 裘(0) 冠(2) 冕(0)
R2袍(0) 褐(0) 裙(0) 衫(5) 襦(0)
R3绶(1) 佩(1) 笏(0) 履(0) 舄(0)
R4帻(0) 弁(0) 铠(0) 甲(1) 兜鍪(0)
R5帛(0) 绢(0) 缟(0) 纱(9) 锦(26)
R6绣(0) 黼(0) 黻(0) 衮(1) 章服(0)
R7带(2) 袂(0) 襟(0) 袖(9) 衽(0)
R8丝(14) 麻(1) 葛(0) 布衣(0) 绵(0)
R9白衣(1) 单衣(1) 紫衣(0) 绯衣(0) 法服(0)
R10蓑(2) 簪(1) 钗(2) 黛(3) 妆(6)

总匹配行数:约85行(去重前),远低于其他文总集

Step 4: grep -n精确搜索

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. 全书以回文诗词为主体,服饰内容极少
  2. 服饰词多为回文结构中的修辞元素——"衣单/单衣""衫薄/薄衫""罗袜/袜罗"等正反读互映
  3. 行345为服饰密度最高的诗句(宝鞲、金络臂、花珥、搔头、轻绡5种服饰)
  4. 苏蕙织锦为全书叙事核心,锦本身为服饰面料
  5. 无任何制度性服饰文献

Step 5: 噪音过滤

噪音类别

有效服饰段落估计:约15段

Step 6: 保存三份文件


关键发现

  1. 《囘文类聚》服饰内容极少——全书400行中有效服饰段落仅约15段,为文总集中服饰含量最低的一类
  2. 回文结构天然适合服饰意象——"衣单/单衣""衫薄/薄衫""罗袜/袜罗"等,服饰词在正反读中互映
  3. 闺怨回文词是服饰最集中的体裁——行253-351的回文词含春衫、罗袜、玉钗、青螺黛、窄衫、轻绡等
  4. 织锦为全书核心——苏蕙织锦回文的叙事本身即与丝织服饰密切相关
  5. 无制度性服饰文献——全书无禁令、赐服、冠服制度等记载

关键踩坑记录


文件大小


审核结果

原文均从grep -n提取,有明确行号对应。由于《囘文类聚》为回文诗总集,服饰内容极少,以诗歌意象为主,无制度性文献,已据实整理。全书服饰价值在于回文词中的闺怨服饰意象与织锦叙事背景。