《西汉文纪》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《西汉文纪》全部服饰相关内容,整理分类总结
操作流程
Step 1: 确认输入文件
```
输入文件 /tmp/daizhige_data/集藏/文总集/西汉文纪.md
wc -l → 2741行,984KB
```
Step 2: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(107) 裳(11) 裘(11) 冠(57) 冕(8) | |
| R2 | 袍(2) 褐(3) 裙(1) 衫(1) 襦(4) | |
| R3 | 绶(29) 佩(11) 笏(0) 履(29) 舄(1) | |
| R4 | 帻(0) 弁(3) 铠(0) 甲(47) 兜鍪(0) | |
| R5 | 帛(51) 绢(0) 缟(4) 纱(0) 锦(8) | |
| R6 | 绣(16) 黼(6) 黻(3) 衮(2) 章服(4) | |
| R7 | 带(27) 袂(1) 襟(0) 袖(2) 衽(1) | |
| R8 | 丝(18) 麻(8) 葛(11) 布衣(11) 绵(5) | |
| R9 | 朝服(0) 祭服(3) 丧服(0) 戎服(0) 法服(1) | |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0) |
总匹配行数:约470行(去重前)
Step 3: grep -n精确搜索
对以下关键词执行grep -n提取行号与上下文:
- 画衣冠异章服(3): 行145/336/1121/1122
- 祭服(3): 行141/199/2031
- 法服(1): 行1033
- 冠带衣裳(2): 行251/1291
- 服饰僭越(1): 行986
- 布衣韦带(1): 行1033
- 赭衣(1): 行1033
- 昌邑王服饰(1): 行500
- 刚卯佩印(1): 行777
- 衮冕黼黻(1): 行2363
关键发现:
- "画衣冠异章服"为全书最独特的服饰制度文献,出现三次
- 贾谊《治安策》中服饰僭越批评为最系统的服饰社会史料
- "甲"47行中绝大部分为甲子纪年
- 印绶制度在西汉极为发达,出现29次
Step 4: 噪音过滤
噪音类别:
- "衣"107行中约65%为"衣食""衣物""衣服"等泛指或非服饰用法
- "甲"47行中约95%为甲子纪年
- "冠"57行中约65%为"冠军""冠绝"等非服饰用法
- "帛"51行中约70%为"金帛""布帛"等外交/经济用语
- "履"29行中约80%为"履行""履历"等动词用法
- "佩"11行中约60%为"佩印""佩服"等
有效服饰段落估计:约25段
Step 5: 保存三份文件
- 文总集output/西汉文纪/原文提取.md
- 文总集output/西汉文纪/总结.md
- 文总集output/西汉文纪/日志.md(本文件)
文件大小
- 原文提取.md:约9KB
- 总结.md:约8KB
- 日志.md:约3KB