《皇明文征》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《皇明文征》全部服饰相关内容
操作流程
Step 1: 确认输入文件
```
wc -l → 21934行
mkdir -p 文总集output/皇明文征/
```
Step 2: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(413) 裳(72) 裘(52) 冠(229) 冕(43) | |
| R2 | 袍(35) 褐(21) 裙(8) 衫(21) 襦(10) | |
| R3 | 绶(21) 佩(83) 笏(20) 履(166) 舄(18) | |
| R4 | 帻(7) 弁(25) 铠(11) 甲(196) | |
| R5 | 帛(64) 绢(11) 缟(16) 纱(20) 锦(118) | |
| R6 | 绣(67) 黼(23) 黻(14) 衮(27) 章服(0) | |
| R7 | 带(117) 袂(28) 襟(40) 袖(35) 衽(2) | |
| R8 | 丝(126) 麻(52) 葛(62) 布衣(33) 绵(50) | |
| R9 | 朝服(1) 祭服(2) 丧服(1) 戎服(3) 法服(1) | |
| R10 | 深衣(5) 缁衣(5) 素衣(0) 朱衣(4) 青衣(5) |
总匹配行数:约1500行(去重前)
有效服饰段落数:约35段
Step 3: 补充搜索
- 衮冕(5) 衮服(3) 乌纱(3) 银绯(2) 团蟒(1)
- 赐银绯(2) 冠服(3) 冠带(2) 衣冠(约20)
- 布衣(33) 深衣(5) 缁衣(5) 朱衣(4) 青衣(5)
Step 4: 噪音过滤
- "衣"413行中约378行为非服饰用法
- "冠"229行中约209行为"冠军""冠绝"等非服饰用法
- "履"166行中约158行为"履行"等非服饰用法
- "甲"196行中约191行为"甲兵""甲第"等泛指
- "布衣"33行中约25行为泛指平民
Step 5: 保存三份文件
- 文总集output/皇明文征/原文提取.md
- 文总集output/皇明文征/总结.md
- 文总集output/皇明文征/日志.md(本文件)
关键发现
- 衮冕朝仪为最隆重服饰场景——衮衣日月冕旒、貂蝉玉带朱衣
- 明代特有服饰有实证记录——乌纱帽、团蟒纱、银绯服
- 民族服饰认同感人至深——至今藏得汉衣服、还着衣冠望乡哭
- 布衣33次为最高频身份词
- 深衣(5)缁衣(5)朱衣(4)青衣(5)——传统服制术语比前书更多
文件大小
- 原文提取.md:约10KB
- 总结.md:约5KB
- 日志.md:约3KB