《吴都文粹》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《吴都文粹》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/吴都文粹续集/原文提取.md
读取 文总集output/吴都文粹续集/总结.md
读取 文总集output/吴都文粹续集/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
指定路径 /home/z/my-project/upload/文总集/文总集/吴都文粹.txt 不存在
→ 在 /tmp/daizhige_data/集藏/文总集/ 找到 吴都文粹.md
wc -l → 2260行
mkdir -p 文总集output/吴都文粹/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(80) 裳(8) 裘(8) 冠(37) 冕(7) | |
| R2 | 袍(5) 褐(2) 裙(5) 衫(3) 襦(1) | |
| R3 | 绶(6) 佩(19) 笏(1) 履(17) 舄(3) | |
| R4 | 帻(5) 弁(6) 铠(0) 甲(37) 兜鍪(0) | |
| R5 | 帛(10) 绢(0) 缟(1) 纱(4) 锦(26) | |
| R6 | 绣(4) 黼(0) 黻(0) 衮(5) 章服(0) | |
| R7 | 带(27) 袂(4) 襟(17) 袖(5) 衽(1) | |
| R8 | 丝(25) 麻(14) 葛(5) 布衣(4) 绵(8) | |
| R9 | 朝服(1) 祭服(0) 丧服(0) 戎服(0) 法服(0) | |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(1) 青衣(0) |
总匹配行数:约230行(去重前)
Step 4: 补充搜索与grep -n精确提取
对以下关键词执行grep -n提取行号与上下文:
- 被华衮垂珠旒(1) 冠章甫衣缝掖(1) 冕旒(1) 端委(2)
- 衣冠(5) 衣冠之薮(1) 衣冠南避(1) 衣冠鳞集(1)
- 赐紫金鱼袋(5) 赐绯鱼袋(3) 金紫光禄大夫(1)
- 衣三品服(1) 赐金带(1) 绿袍(2) 墨绶(1) 黄绶(1) 紫绶(1)
- 章绶相辉(1) 冠佩陆离(1) 垂组彯缨(1) 簪组(1) 簪缨(1)
- 幅巾(1) 布衣(4) 鹿裘(1) 褐衣白袷(1) 春衫(1) 纱巾(1) 紫纶巾(1)
- 赐紫方袍(1) 方袍圆笠(1) 袈裟(2) 一衲(1)
- 红妆珠佩(1) 银泥裙(1) 珠襦(1) 流苏(1) 古罗衣(1) 吴绡(1)
- 朝服(1) 以笏叩头(1) 冠冕不绝(1)
关键发现:
- 行655王禹偁《昆山县重修文宣王庙记》为全书最集中的服饰文献
- 赐紫金鱼袋5例,赐绯鱼袋3例,为碑记署名高频词
- 行659、2168"端委"两见,为吴地服饰文明之源
- 行907"衣三品服"为直接官服描述
- 行979苏舜钦沧浪亭"幅巾以往"为隐逸服饰经典
- 衣冠5处均为地域文化意象,非具体服饰描述
- 本书规模远小于续集(2260行vs9765行),服饰内容亦较少
Step 5: 噪音过滤
噪音类别:
- "衣"80行中约72行为非服饰用法(衣食、衣被、蚕而衣、解衣推食等)
- "甲"37行中约36行为天干"甲子"或科举"甲科"
- "带"27行中约22行为非服饰用法(地带、连带等)
- "佩"19行中约16行为"钦佩""敬佩"非佩饰
- "履"17行中约16行为"履践""履历"非鞋履
- "襟"17行中约15行为"胸襟""襟带"非服饰
- "锦"26行中约23行为"锦绣"泛指或地名
有效服饰段落估计:约25段
Step 6: 保存三份文件
- 文总集output/吴都文粹/原文提取.md
- 文总集output/吴都文粹/总结.md
- 文总集output/吴都文粹/日志.md(本文件)
关键发现
- 文庙像设为全书最集中的服饰文献:行655被华衮垂珠旒、冠章甫衣缝掖
- 官服品秩章绶文献丰富:赐紫金鱼袋5例,衣三品服1例
- 衣冠为地域文化核心意象:衣冠之薮、衣冠南避、衣冠之所鳞集
- 太伯端委为吴地服饰文明之源:行659、2168两见
- 幅巾为隐逸服饰经典:苏舜钦沧浪亭记
关键踩坑记录
- 输入文件不在指定路径,在 /tmp/daizhige_data/ 找到(.md而非.txt)
- 全书仅2260行,规模远小于续集,服饰内容较少
- "衣冠"5行均为泛指士大夫或地域文化,非具体服饰描述
- "甲"37行中绝大多数为天干,无甲胄用法
- 朝服仅1处(行947朝服涉泞),深衣、祭服、章服等术语缺失
- 赐服制度较少,远不如续集丰富(续集有韩世忠碑传、嘉靖改制等)
- "衣"字80行中大量为"衣食""衣被""解衣推食"等非服饰用法
文件大小
- 原文提取.md:约7KB
- 总结.md:约6KB
- 日志.md:约3KB
审核结果
原文均从grep -n提取,有明确行号对应。《吴都文粹》为宋郑虎臣编吴地诗文总集,服饰内容以文庙像设衮冕与官服品秩章绶为核心,与续集相比规模较小、服饰文献较少。已据实整理,未灌水凑字。