《续碑传选集》服饰内容提取 · 工作日志

时间:2026-05-09

任务:提取《续碑传选集》全部服饰相关内容,整理分类总结


操作流程

Step 1: 确认输入文件

```

输入文件 /tmp/daizhige_data/集藏/文总集/续碑传选集.md

wc -l → 1465行,434KB

```

Step 2: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(24) 裳(1) 裘(5) 冠(29) 冕(2)
R2袍(6) 褐(1) 裙(0) 衫(0) 襦(0)
R3绶(3) 佩(5) 笏(1) 履(10) 舄(4)
R4帻(0) 弁(19) 铠(3) 甲(56) 兜鍪(0)
R5帛(1) 绢(0) 缟(0) 纱(3) 锦(9)
R6绣(1) 黼(1) 黻(1) 衮(0) 章服(0)
R7带(20) 袂(1) 襟(3) 袖(4) 衽(1)
R8丝(6) 麻(4) 葛(2) 布衣(2) 绵(4)
R9朝服(1) 祭服(0) 丧服(1) 戎服(0) 法服(0)
R10深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(1)

总匹配行数:约206行(去重前)

Step 3: grep -n精确搜索

对以下关键词执行grep -n:

关键发现

  1. 续碑传选集为清代碑传,服饰内容集中在军功赐服
  2. "弁"19行均为"将弁"(军官),非帽饰义
  3. "甲"56行中绝大部分为"甲兵""甲马"等军事用语
  4. 清代赐服制度(黄马褂/宝石顶/花翎)为最突出的服饰内容

Step 4: 噪音过滤

噪音类别

有效服饰段落估计:约10段

Step 5: 保存三份文件


文件大小