《论学绳尺》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《论学绳尺》全部服饰相关内容,整理分类总结
操作流程
Step 1: 确认输入文件
```
输入文件 /tmp/daizhige_data/集藏/文总集/论学绳尺.md
wc -l → 1324行,1.3MB
```
Step 2: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(32) 裳(6) 裘(5) 冠(36) 冕(7) | |
| R2 | 袍(2) 褐(2) 裙(0) 衫(0) 襦(0) | |
| R3 | 绶(3) 佩(2) 笏(1) 履(17) 舄(0) | |
| R4 | 帻(0) 弁(1) 铠(0) 甲(32) 兜鍪(0) | |
| R5 | 帛(21) 绢(0) 缟(1) 纱(0) 锦(4) | |
| R6 | 绣(3) 黼(2) 黻(2) 衮(6) 章服(0) | |
| R7 | 带(9) 袂(0) 襟(3) 袖(0) 衽(2) | |
| R8 | 丝(6) 麻(4) 葛(16) 布衣(1) 绵(5) | |
| R9 | 朝服(0) 祭服(0) 丧服(2) 戎服(1) 法服(0) | |
| R10 | 深衣(1) 缁衣(2) 素衣(0) 朱衣(0) 青衣(0) |
总匹配行数:约192行(去重前)
Step 3: grep -n精确搜索
对以下关键词执行grep -n提取行号与上下文:
- 衣裳与治道:垂衣裳(2) 衣裳宫室(1) 冠裳之仪(1) 茹毛荷毳(1)
- 三代衣制:燕衣(1) 缟衣(1) 元衣(1) 养老(1)
- 文帝服饰:弋绨(2) 戎服(1) 丧服(2)
- 华夷服饰:衣冠礼乐(1) 裘罽(1) 冠带衣裳(2) 毡裘(1) 葛衣(1)
- 儒者服饰:襃衣博带(1) 短衣楚制(1) 深衣大带(1) 颠倒衣冠(1)
关键发现:
- 论学绳尺为科举范文批注集,服饰内容全部为经史典故征引
- 三代衣制(燕衣/缟衣/元衣)为礼制文献的重要汇总
- 叔孙通"短衣楚制"为服饰政治学的经典案例
- "衮"6行均为"衮职"等非服饰用法
- "甲"32行中绝大部分为甲子纪年
Step 4: 噪音过滤
噪音类别:
- "甲"32行中约95%为甲子纪年
- "冠"36行中约60%为"冠绝""加冠""冠军"等非服饰用法
- "帛"21行中约80%为"金帛""玉帛"等外交用语
- "葛"16行中约60%为"葛"姓人名或地名
- "履"17行中约80%为"履行""履历"等动词用法
- "衣"32行中约60%为"衣冠""衣食""衣服"等泛指
有效服饰段落估计:约15段
Step 5: 保存三份文件
- 文总集output/论学绳尺/原文提取.md
- 文总集output/论学绳尺/总结.md
- 文总集output/论学绳尺/日志.md(本文件)
文件大小
- 原文提取.md:约8KB
- 总结.md:约7KB
- 日志.md:约3KB