左传杜解补正——服饰提取工作日志
任务信息
| 项目 | 内容 |
|---|---|
| Task ID | batch3-4 |
| 书名 | 左传杜解补正 |
| 输入文件 | /home/z/my-project/春秋/左传杜解补正.txt |
| 输出目录 | /home/z/my-project/春秋output2/左传杜解补正/ |
| 总行数 | 575行 |
工作流程
第1轮:创建输出目录
- 执行
mkdir -p /home/z/my-project/春秋output2/左传杜解补正/ - 确认文件575行
第2轮:多轮grep提取服饰相关行号
Grep批次1:制度类+衣冠类+材料类+颜色类+礼服类+动作类+纺织类
关键词分组搜索:
| 批次 | 关键词 | 命中行 |
|---|---|---|
| 制度类 | 服色/舆服/冠服/章服/服制/服章 | 0行 |
| 衣冠类 | 衣/裳/裘/弁/佩/冠/冕/袍/带/履/舄/巾/帽/绶/笏/黼/黻 | 14行(76,77,81,95,111,146,334,363,405,412,438,462,526,541) |
| 材料类 | 丝/帛/绢/锦/绮/绫/罗/缎/葛/麻/褐/纩/绵 | 6行(47,81,183,208,219,405,448,542) |
| 颜色+礼服类 | 紫袍/绯袍/绿袍/青衣/朱衣/玄衣/黄衣/白衣/衮服/深衣/皮弁/玄冕/衮冕/鷩冕/毳冕/絺冕 | 0行 |
| 动作+纺织类 | 赐服/赐紫/赐绯/加冠/加元服/蚕/桑/织/纺/染/绣 | 3行(80,290,405,466) |
Grep批次2:补充搜索
| 批次 | 关键词 | 新增行 |
|---|---|---|
| 服/韨/韠/韎/韐等 | 服 | 多行(含大量"服"字训诂条目,如"服虔""服防"等,需甄别) |
| 袀/袞/褖/襦等 | 袀 | 第95行 |
| 旒/旂/旆/旗/繁缨 | 旒/旂/繁缨/就 | 第426,541,547,562行 |
| 玉/璧/珪/璋等 | 玉/璧/珪/璋/琥/璜/瓒 | 第76,111,152,193,317,405,412,442,541,542行 |
| 丧服类 | 丧服/斩衰/齐衰/缌麻/大功/小功/袒/免/绖 | 第320,341,451,468,551行 |
| 韦/鞞/赤/朱/玄/素 | 韦/赤/朱/玄/素 | 第87,120,131,262,376,452,486,494行 |
Grep批次3:精筛与去重
- 去除"服虔""服防"等非服饰条目(为古人名)
- 去除纯地理、军事等无关条目
- 最终确定27条服饰相关内容
第3轮:精读与学术审查
- 逐条阅读相关行上下文
- 标注3条边缘条目(第22条"纺"、第27条"履薪"、第448行"怀锦")
- 确认所有条目均与服饰制度、衣冠器物、丧服礼制有直接或间接关联
第4轮:撰写输出文件
- 左传杜解补正_原文提取.md:27条原文,分6类编排
- 左传杜解补正_总结.md:6章总结,含学术价值评估与对抗式审查
- 左传杜解补正_日志.md:本文件
数据质量报告
| 指标 | 数值 |
|---|---|
| 总行数 | 575 |
| grep命中行数(去重前) | ~60行 |
| 有效服饰条目 | 27条 |
| 误命中率 | ~55%(主要为"服虔""服防"等人名) |
| 边缘条目 | 3条(已标注) |
| 片段大小 | <50KB(远低于1M限制) |
| 单篇MD大小 | <20KB |
注意事项
- 本书中"服"字大量出现为"服虔""服防"(汉代经学家),需仔细甄别
- "褚"字在本书中为衣橐之义,非服饰穿着本身,但与衣冠存放相关
- 第405条信息密度最高,涉及圭、璋、璧、琮、琥、璜六种玉器与帛、锦、绣、黼四种丝织品的礼制配套