《囘文类聚》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《囘文类聚》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/全辽文/原文提取.md
读取 文总集output/全辽文/总结.md
读取 文总集output/全辽文/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/囘文类聚.txt 不存在
→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/囘文类聚.md
→ 保存为 /home/z/my-project/upload/文总集/文总集/囘文类聚.txt
wc -l → 400行,41KB
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(9) 裳(1) 裘(0) 冠(2) 冕(0) | |
| R2 | 袍(0) 褐(0) 裙(0) 衫(5) 襦(0) | |
| R3 | 绶(1) 佩(1) 笏(0) 履(0) 舄(0) | |
| R4 | 帻(0) 弁(0) 铠(0) 甲(1) 兜鍪(0) | |
| R5 | 帛(0) 绢(0) 缟(0) 纱(9) 锦(26) | |
| R6 | 绣(0) 黼(0) 黻(0) 衮(1) 章服(0) | |
| R7 | 带(2) 袂(0) 襟(0) 袖(9) 衽(0) | |
| R8 | 丝(14) 麻(1) 葛(0) 布衣(0) 绵(0) | |
| R9 | 白衣(1) 单衣(1) 紫衣(0) 绯衣(0) 法服(0) | |
| R10 | 蓑(2) 簪(1) 钗(2) 黛(3) 妆(6) |
总匹配行数:约85行(去重前),远低于其他文总集
Step 4: grep -n精确搜索
对以下关键词执行grep -n提取行号与上下文:
- 礼服:衮衣(1) 龙旂容衣(1)
- 日常衣物:白衣(1) 单衣(1) 缕金衣(1) 旧衣(1) 袭衣(1)
- 衫类:碧衫(2) 春衫(1) 薄衫(2) 窄衫(1)
- 隐逸服饰:衣蓑(2)
- 丝织物:罗袜(1) 氷丝縠(1) 轻绡(1)
- 首饰:玉钗(1) 玉佩(1) 宝鞲(1) 花珥搔头(1)
- 妆饰:青螺黛(1) 敛黛(1) 薄粉(1) 巾带(1) 整冠簪(1)
- 织锦背景:织锦(9) 缣素(1) 绮罗(2)
关键发现:
- 全书以回文诗词为主体,服饰内容极少
- 服饰词多为回文结构中的修辞元素——"衣单/单衣""衫薄/薄衫""罗袜/袜罗"等正反读互映
- 行345为服饰密度最高的诗句(宝鞲、金络臂、花珥、搔头、轻绡5种服饰)
- 苏蕙织锦为全书叙事核心,锦本身为服饰面料
- 无任何制度性服饰文献
Step 5: 噪音过滤
噪音类别:
- "锦"26行中约70%为"织锦""回文锦"等文学/书名用语,非服饰描写
- "织"17行中约60%为"织锦""织文"等语境
- "衣"9行中约20%为"衣食"等非服饰用法
- "甲"1行为科甲纪年
- "绶"1行为"垂绶"指锦文图案,非官服绶带
- "纱"9行中约50%为"纱窗",非纱衣
- "粉"9行中约70%为"花粉",非妆粉
- "丝"14行中约50%为"柳丝""藕丝"等非丝织品
- "衾"5行为被褥,非服饰
- "罗"4行中2行为"罗网",非丝罗
有效服饰段落估计:约15段
Step 6: 保存三份文件
- 文总集output/囘文类聚/原文提取.md
- 文总集output/囘文类聚/总结.md
- 文总集output/囘文类聚/日志.md(本文件)
关键发现
- 《囘文类聚》服饰内容极少——全书400行中有效服饰段落仅约15段,为文总集中服饰含量最低的一类
- 回文结构天然适合服饰意象——"衣单/单衣""衫薄/薄衫""罗袜/袜罗"等,服饰词在正反读中互映
- 闺怨回文词是服饰最集中的体裁——行253-351的回文词含春衫、罗袜、玉钗、青螺黛、窄衫、轻绡等
- 织锦为全书核心——苏蕙织锦回文的叙事本身即与丝织服饰密切相关
- 无制度性服饰文献——全书无禁令、赐服、冠服制度等记载
关键踩坑记录
- 输入文件不存在于指定路径,需从殆知阁GitHub仓库下载(data分支)
- 囘=回的异体字,文件名为"囘文类聚"而非"回文类聚"
- "锦"出现26行但绝大部分为"织锦""回文锦"的文学/书名语境,非服饰描写
- "纱"9行中约50%为"纱窗",非纱衣
- "绶"仅1行,为"垂绶"指锦文图案,非官服绶带
- 回文诗词中的服饰词具有特殊的修辞功能——正反读互映,不同于一般诗文中的服饰描写
- 本书为诗歌总集,以文学创作为主,服饰仅为诗中意象
文件大小
- 原文提取.md:约8KB
- 总结.md:约7KB
- 日志.md:约4KB
审核结果
原文均从grep -n提取,有明确行号对应。由于《囘文类聚》为回文诗总集,服饰内容极少,以诗歌意象为主,无制度性文献,已据实整理。全书服饰价值在于回文词中的闺怨服饰意象与织锦叙事背景。