《西汉文纪》服饰内容提取 · 工作日志

时间:2026-05-09

任务:提取《西汉文纪》全部服饰相关内容,整理分类总结


操作流程

Step 1: 确认输入文件

```

输入文件 /tmp/daizhige_data/集藏/文总集/西汉文纪.md

wc -l → 2741行,984KB

```

Step 2: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(107) 裳(11) 裘(11) 冠(57) 冕(8)
R2袍(2) 褐(3) 裙(1) 衫(1) 襦(4)
R3绶(29) 佩(11) 笏(0) 履(29) 舄(1)
R4帻(0) 弁(3) 铠(0) 甲(47) 兜鍪(0)
R5帛(51) 绢(0) 缟(4) 纱(0) 锦(8)
R6绣(16) 黼(6) 黻(3) 衮(2) 章服(4)
R7带(27) 袂(1) 襟(0) 袖(2) 衽(1)
R8丝(18) 麻(8) 葛(11) 布衣(11) 绵(5)
R9朝服(0) 祭服(3) 丧服(0) 戎服(0) 法服(1)
R10深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0)

总匹配行数:约470行(去重前)

Step 3: grep -n精确搜索

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. "画衣冠异章服"为全书最独特的服饰制度文献,出现三次
  2. 贾谊《治安策》中服饰僭越批评为最系统的服饰社会史料
  3. "甲"47行中绝大部分为甲子纪年
  4. 印绶制度在西汉极为发达,出现29次

Step 4: 噪音过滤

噪音类别

有效服饰段落估计:约25段

Step 5: 保存三份文件


文件大小