《经义模范》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《经义模范》全部服饰相关内容,整理分类总结
操作流程
Step 1: 确认输入文件
```
输入文件 /tmp/daizhige_data/集藏/文总集/经义模范.md
wc -l → 109行,39KB
```
Step 2: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(3) 裳(1) 裘(0) 冠(2) 冕(0) | |
| R2 | 袍(0) 褐(0) 裙(0) 衫(0) 襦(0) | |
| R3 | 绶(0) 佩(1) 笏(0) 履(3) 舄(0) | |
| R4 | 帻(0) 弁(1) 铠(0) 甲(3) 兜鍪(0) | |
| R5 | 帛(0) 绢(0) 缟(0) 纱(0) 锦(0) | |
| R6 | 绣(0) 黼(0) 黻(0) 衮(1) 章服(0) | |
| R7 | 带(0) 袂(0) 襟(0) 袖(0) 衽(0) | |
| R8 | 丝(0) 麻(0) 葛(1) 布衣(0) 绵(1) | |
| R9 | 朝服(0) 祭服(0) 丧服(0) 戎服(0) 法服(0) | |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0) |
总匹配行数:约16行(去重前)
Step 3: 噪音过滤
噪音类别:
- "履"3行均为"履历""跋履"等动词用法
- "甲"3行均为甲子纪年
- "弁"1行为"弁首"(篇首)
- "裳"1行为人名"朱裳"
- "衣"3行中仅2行为服饰义
有效服饰段落估计:仅4处
Step 4: 保存三份文件
- 文总集output/经义模范/原文提取.md
- 文总集output/经义模范/总结.md
- 文总集output/经义模范/日志.md(本文件)
文件大小
- 原文提取.md:约3KB
- 总结.md:约3KB
- 日志.md:约2KB