《皇明文征》服饰内容提取 · 工作日志

时间:2026-05-09

任务:提取《皇明文征》全部服饰相关内容


操作流程

Step 1: 确认输入文件

```

wc -l → 21934行

mkdir -p 文总集output/皇明文征/

```

Step 2: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(413) 裳(72) 裘(52) 冠(229) 冕(43)
R2袍(35) 褐(21) 裙(8) 衫(21) 襦(10)
R3绶(21) 佩(83) 笏(20) 履(166) 舄(18)
R4帻(7) 弁(25) 铠(11) 甲(196)
R5帛(64) 绢(11) 缟(16) 纱(20) 锦(118)
R6绣(67) 黼(23) 黻(14) 衮(27) 章服(0)
R7带(117) 袂(28) 襟(40) 袖(35) 衽(2)
R8丝(126) 麻(52) 葛(62) 布衣(33) 绵(50)
R9朝服(1) 祭服(2) 丧服(1) 戎服(3) 法服(1)
R10深衣(5) 缁衣(5) 素衣(0) 朱衣(4) 青衣(5)

总匹配行数:约1500行(去重前)

有效服饰段落数:约35段

Step 3: 补充搜索

Step 4: 噪音过滤

Step 5: 保存三份文件


关键发现

  1. 衮冕朝仪为最隆重服饰场景——衮衣日月冕旒、貂蝉玉带朱衣
  2. 明代特有服饰有实证记录——乌纱帽、团蟒纱、银绯服
  3. 民族服饰认同感人至深——至今藏得汉衣服、还着衣冠望乡哭
  4. 布衣33次为最高频身份词
  5. 深衣(5)缁衣(5)朱衣(4)青衣(5)——传统服制术语比前书更多

文件大小