研究总结 日志 原文

左传杜解补正——服饰提取工作日志

任务信息

项目 内容
Task ID batch3-4
书名 左传杜解补正
输入文件 /home/z/my-project/春秋/左传杜解补正.txt
输出目录 /home/z/my-project/春秋output2/左传杜解补正/
总行数 575行

工作流程

第1轮:创建输出目录

第2轮:多轮grep提取服饰相关行号

Grep批次1:制度类+衣冠类+材料类+颜色类+礼服类+动作类+纺织类

关键词分组搜索:

批次 关键词 命中行
制度类 服色/舆服/冠服/章服/服制/服章 0行
衣冠类 衣/裳/裘/弁/佩/冠/冕/袍/带/履/舄/巾/帽/绶/笏/黼/黻 14行(76,77,81,95,111,146,334,363,405,412,438,462,526,541)
材料类 丝/帛/绢/锦/绮/绫/罗/缎/葛/麻/褐/纩/绵 6行(47,81,183,208,219,405,448,542)
颜色+礼服类 紫袍/绯袍/绿袍/青衣/朱衣/玄衣/黄衣/白衣/衮服/深衣/皮弁/玄冕/衮冕/鷩冕/毳冕/絺冕 0行
动作+纺织类 赐服/赐紫/赐绯/加冠/加元服/蚕/桑/织/纺/染/绣 3行(80,290,405,466)

Grep批次2:补充搜索

批次 关键词 新增行
服/韨/韠/韎/韐等 多行(含大量"服"字训诂条目,如"服虔""服防"等,需甄别)
袀/袞/褖/襦等 第95行
旒/旂/旆/旗/繁缨 旒/旂/繁缨/就 第426,541,547,562行
玉/璧/珪/璋等 玉/璧/珪/璋/琥/璜/瓒 第76,111,152,193,317,405,412,442,541,542行
丧服类 丧服/斩衰/齐衰/缌麻/大功/小功/袒/免/绖 第320,341,451,468,551行
韦/鞞/赤/朱/玄/素 韦/赤/朱/玄/素 第87,120,131,262,376,452,486,494行

Grep批次3:精筛与去重

第3轮:精读与学术审查

第4轮:撰写输出文件

数据质量报告

指标 数值
总行数 575
grep命中行数(去重前) ~60行
有效服饰条目 27条
误命中率 ~55%(主要为"服虔""服防"等人名)
边缘条目 3条(已标注)
片段大小 <50KB(远低于1M限制)
单篇MD大小 <20KB

注意事项

  1. 本书中"服"字大量出现为"服虔""服防"(汉代经学家),需仔细甄别
  2. "褚"字在本书中为衣橐之义,非服饰穿着本身,但与衣冠存放相关
  3. 第405条信息密度最高,涉及圭、璋、璧、琮、琥、璜六种玉器与帛、锦、绣、黼四种丝织品的礼制配套