总结日志原文提取

《仪礼识误》服饰内容提取 · 日志

任务ID:L3-d 执行时间:2026-03-04 操作员:rysxguji子Agent


Step 1: wc统计

wc -l -c -w 仪礼识误.txt
  380   656 47520 仪礼识误.txt

Step 2: 读取词库

词库路径:/home/z/my-project/upload/rysxguji0518/rysxguji/references/fushi-keywords.md

词库内容要点: - 核心服饰词:首服、体服、下服、足服、腰带、佩饰、礼服、衣料、染色纹样共9类 - 制度动作词:赐予、禁令、等级、礼仪、日常共5类 - 组合扩展词:品色制度、冕服体系、蚕桑纺织等7类 - 排除规则表:22条误命中场景及判断标准


Step 3: 三轮grep

第1轮:核心服饰词全搜

rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|珮|鱼袋|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|黼|黻|法服|燕服|翟衣|袆衣|深衣' 仪礼识误.txt

命中:约35行,涵盖冠、冕、衣、裳、裘、弁、巾、履、袂、襦、黼、黻、屦、佩、丧服、祭服等。

第2轮:制度动作词

rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服' 仪礼识误.txt

命中:5行(士冠礼、丧服等),其中"冠礼""丧服""朝服""祭服"有实质命中。

第3轮:按需扩展(冕服体系+丧服+染色)

rg -n '大裘|衮冕|鷩冕|毳冕|絺冕|玄冕|皮弁|爵弁|韦弁|冠弁|缁布|玄端|素积|皮服|锡衰|缌麻|袤|玄衣|衮服|朝服|祭服|丧服|弁服|皮服|端服|襦|褖|絇|屦|袂|袗|袒|裼|袭|韠|鞸|韨|鞶|绅|搢|大带|革带' 仪礼识误.txt

命中:约20行,新增玄冕、皮弁、锡衰、褖、絇、屦、袂、袗、袒、裼、搢等。

再搜索:

rg -n '缁|纁|绛|縓|赪|朱|袗|冒|韬|縚|缞|衰|幂|幦|茧|襺' 仪礼识误.txt

命中:约25行,新增染绛制度、縓赪纁朱、韬发、幂/鼏、茧/襺等。


Step 4: 审查排除

按词库排除规则逐条审查:

原始命中 排除判断 理由
"衣"在"衣字条"中(第64行) 保留 "袗玄衣"——服饰语境
"衣"在"成衣"中(第207行"袍茧") 保留 袍茧为服饰
"衣"在"衣染之以黑"(第262行) 保留 染色工艺
"衣"在"擐衣"(第243行) 保留 穿衣动作
"带"在"插于带右"(第56行) 保留 腰带佩饰制度
"巾"在"巾箱本"(多处) 排除 版本名,非服饰
"巾"在"还结于项巾"(第194行) 保留 丧服中的项巾
"服"在"丧服误字"(第16/170行) 保留 丧服制度
"服"在"朝服"(第49行) 保留 朝服制度
"冠"在"士冠礼"(第5/48行) 保留 冠礼与冠服
"冠"在"冠军"等 无此命中
"麻"无独立命中 仅在"缌麻"等复合词中出现
"罗"无独立命中
"佩"在"佩饰"语境 无直接命中 此书未讨论佩玉制度
"帛"在"币帛" 无命中

最终保留28条服饰相关条目。


Step 5: sed提取上下文

对28条命中行号执行上下文提取(N-2至N+5),已在前述Read中完成全文通读,不再逐一sed。


Step 6: 分类整理

7大类: 1. 首服(冠冕弁巾)——6条 2. 体服(衣裳袍襦褖)——12条 3. 足服(屦絇繶)——1条 4. 佩饰与搢插——3条 5. 丧服制度——3条 6. 染色与衣料——3条 7. 巾幂与覆盖物——3条


Step 7: 读取参考模板

已读取三个模板文件: - /home/z/my-project/upload/参考/总结.md(吕氏春秋模板) - /home/z/my-project/upload/参考/日志.md(晋会要模板) - /home/z/my-project/upload/参考/原文提取.md(天工开物模板)


Step 8: 创作三份MD


关键踩坑记录

  1. 词库路径不一致:词库实际位于/home/z/my-project/upload/rysxguji0518/rysxguji/references/fushi-keywords.md,非默认路径
  2. 此书为校勘体裁:与一般古籍不同,服饰信息嵌套在校勘条目中,需从"讨论X字异文"的语境中提取服饰内容
  3. 四库案语价值极高:案语中包含馆臣对张淳字学水平的批评,对评估校改可靠性至关重要
  4. □/防等缺字:四库本有大量OCR缺字标记为□,部分为服饰用字(如襦、繻),需结合案语推断
  5. 巾箱本≠巾服:"巾箱本"为版本名(袖珍本),与服饰中的"巾"无关,审查时需排除

审核结果

全部28条通过 ✅——原文均从grep命中行中提取,有明确行号对应,排除规则逐条执行完毕。