总结日志原文提取

《夏小正戴氏传》服饰内容提取·日志

时间:2026-03-04 任务ID:L10-Book1 全书:86行(小文件,可整本载入)


操作流程

Step 1: wc统计

86 行 /home/z/my-project/upload/礼经_extracted/礼经/夏小正戴氏传.txt

Step 2: 读取词库

词库路径:/home/z/my-project/upload/rysxguji0518/rysxguji/references/fushi-keywords.md - 核心服饰词:衣、裳、冠、冕、袍、裘、带、佩等70+词 - 制度动作词:赐服、僭、逾制、冠礼、笄礼等14词 - 组合扩展词:蚕桑纺织、品色制度、冕服体系等8组 - 排除规则表:衣/裳/冠/带/佩/服/罗/环/褐/帛等误命中场景

Step 3: 三轮grep

第1轮:核心服饰词

命中6行:Line 4, 14, 32, 42, 43, 59, 60, 61
关键命中:
- 衣:Line 42(乃衣瓜), 43(衣也者始创衣也), 59(妇人未嫁者衣之)
- 裘:Line 60(王始裘), 61(衣裘之时也)
- 冠:Line 32(冠子取妇之时也)
- 帛:Line 4, 14(赏帛/徼赏帛)→排除,非服饰语境
- 织:Line 56, 57, 74, 75(织女星名)→排除,非纺织义

第2轮:制度动作词

命中0行
(全书无赐服、僭、逾制、冠礼等制度动作词)

第3轮:组合扩展词——蚕桑纺织

命中4行:
- Line 14: "躬桑""蚕事""妾子始蚕"(序文引郑注)
- Line 33: "摄桑""妾子始蚕执养宫事"(三月传文)
- Line 56, 57: "织女正东乡"→排除,星名非纺织
- Line 74, 75: "织女正北乡"→排除,星名非纺织

Step 4: 审查排除

原始命中 语境 判定
Line 4 "赏帛" "隋重赏以求逸书进书遂多以邀赏帛" ❌ 排除——赏赐丝帛非服饰
Line 14 "赏帛" 同上 ❌ 排除
Line 56,57,74,75 "织女" "初昬织女正东乡""织女正北乡则旦" ❌ 排除——星名,非纺织人
Line 42 "衣瓜" "乃衣瓜,瓜者急瓜之辞也" ⚠️ 保留——"衣"作动词,旧注异文含服饰义
Line 32 "冠子" "冠子取妇之时也" ✅ 保留——冠礼条目

Step 5: sed提取

已整本读取,无需单独sed。关键行已全部覆盖。

Step 6: 分类

Step 7: 读取参考文件

已读取: - /home/z/my-project/upload/参考/总结.md(吕氏春秋总结——月令服色体系参考) - /home/z/my-project/upload/参考/日志.md(晋会要日志——操作流程参考) - /home/z/my-project/upload/参考/原文提取.md(天工开物原文——丝织工艺参考)

Step 8: 创作三份MD


关键踩坑

  1. "织女"误命中:全书4处"织女"均为星名(Vega),非纺织义,需排除
  2. "帛"字误命中:2处"赏帛"均为"以丝帛为赏赐",非服饰语境
  3. "衣瓜"歧义:主流解为"包裹瓜果",异文含"始创衣"说,两种解读差异巨大
  4. 全书极短:仅86行,服饰实质内容仅5处,信息密度低

审核结果

全部通过 ✅ — 原文均从TXT直接读取提取,有明确行号对应。排除项已逐一审查。