《论学绳尺》服饰内容提取 · 工作日志

时间:2026-05-09

任务:提取《论学绳尺》全部服饰相关内容,整理分类总结


操作流程

Step 1: 确认输入文件

```

输入文件 /tmp/daizhige_data/集藏/文总集/论学绳尺.md

wc -l → 1324行,1.3MB

```

Step 2: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(32) 裳(6) 裘(5) 冠(36) 冕(7)
R2袍(2) 褐(2) 裙(0) 衫(0) 襦(0)
R3绶(3) 佩(2) 笏(1) 履(17) 舄(0)
R4帻(0) 弁(1) 铠(0) 甲(32) 兜鍪(0)
R5帛(21) 绢(0) 缟(1) 纱(0) 锦(4)
R6绣(3) 黼(2) 黻(2) 衮(6) 章服(0)
R7带(9) 袂(0) 襟(3) 袖(0) 衽(2)
R8丝(6) 麻(4) 葛(16) 布衣(1) 绵(5)
R9朝服(0) 祭服(0) 丧服(2) 戎服(1) 法服(0)
R10深衣(1) 缁衣(2) 素衣(0) 朱衣(0) 青衣(0)

总匹配行数:约192行(去重前)

Step 3: grep -n精确搜索

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. 论学绳尺为科举范文批注集,服饰内容全部为经史典故征引
  2. 三代衣制(燕衣/缟衣/元衣)为礼制文献的重要汇总
  3. 叔孙通"短衣楚制"为服饰政治学的经典案例
  4. "衮"6行均为"衮职"等非服饰用法
  5. "甲"32行中绝大部分为甲子纪年

Step 4: 噪音过滤

噪音类别

有效服饰段落估计:约15段

Step 5: 保存三份文件


文件大小