总结日志原文提取

《仪礼要义》服饰内容提取 · 工作日志

任务ID:L3-c 处理时间:2026-03-05 输入文件:/home/z/my-project/upload/礼经_extracted/礼经/仪礼要义.txt 输出目录:/home/z/my-project/upload/礼经重制output/仪礼要义/


操作流程

Step 1: wc统计(不读内容)

wc -l -c -w 仪礼要义.txt
→ 4285行 4984词 913581字节(约892KB)
→ 大文件!禁止整本载入。

Step 2: 读取服饰词库

词库路径:/home/z/my-project/upload/rysxguji0518/rysxguji/references/fushi-keywords.md
→ 核心服饰词(首服/体服/下服/足服/腰带/佩饰/礼服/衣料/染色纹样)
→ 制度动作词(赐予/禁令/等级/礼仪/日常)
→ 组合扩展词(品色制度/冕服体系/蚕桑纺织等)
→ 排除规则表(衣/麻/罗/环/领/带/佩/服/冠等歧义词排除标准)

Step 3: 三轮grep

第1轮:核心服饰词全搜

rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|……' 仪礼要义.txt
→ 命中789行

第2轮:制度动作词

rg -n '赐服|赐紫|僭|逾制|品色|冠礼|笄礼|加冠|……' 仪礼要义.txt
→ 命中79行

第3轮:组合扩展词

rg -n '大裘而冕|衮冕|皮弁|爵弁|玄端|衰|绖|……' 仪礼要义.txt
→ 命中426行

各核心词频次统计: | 关键词 | 命中行数 | | 关键词 | 命中行数 | |--------|---------|-|--------|---------| | 冠 | 248 | | 帛 | 100 | | 弁 | 102 | | 朝服 | 94 | | 裳 | 90 | | 麻 | 84 | | 巾 | 57 | | 屦 | 43 | | 冕 | 42 | | 丧服 | 40 | | 锦 | 33 | | 祭服 | 27 | | 葛 | 25 | | 深衣 | 20 | | 缨 | 19 | | 裘 | 18 |

Step 4: 审查排除误命中

按排除规则表逐条审查:

结论:因本书为经学注疏体,词汇语境单一,误命中率极低,几乎无需排除。

Step 5: sed提取上下文

对关键段落进行sed提取(仅列重要行号范围):

行号范围 内容 篇属
22-27 三加冠服总论 士冠礼
41-46 玄冠朝服缁带素韠 士冠礼
99-122 爵弁服/皮弁服/玄端 士冠礼
124-170 缁布冠/笄纮/三加/采衣 士冠礼
259-275 屦制三服 士冠礼
370-380 亲迎爵弁纁裳 士昏礼
407-445 女服/姆服/缨笄 士昏礼
1577 皮弁聘至于朝 聘礼
1591 公皮弁迎宾 聘礼
2368-2420 丧服五服总论/斩衰详制 丧服经传
2438-2500 丧服受服变除/齐衰 丧服经传

Step 6: 分类整理

共分9大类: 1. 冠服体系(首服) 2. 昏礼服饰 3. 丧服制度(核心) 4. 屦制(足服) 5. 韠韨制度(蔽膝) 6. 染色制度 7. 聘礼服饰(袭裼) 8. 佩饰(笄纮缨) 9. 衣料(丝布升制)

Step 7: 读取参考模板

参考目录:/home/z/my-project/upload/参考/
→ 总结.md(吕氏春秋示例,含对抗式学术审查)
→ 日志.md(晋会要示例,含操作流程+踩坑记录)
→ 原文提取.md(天工开物示例,含原文分级引用)

Step 8: 创作三份MD


关键发现

  1. 丧服篇为服饰内容最密集处:全书50卷中丧服占7卷(卷23-29),涉及五服制度、衰裳升数、绖带尺寸、冠缨缝制、杖屦材质等,是先秦服饰制度最系统的理论阐述
  2. "五分去一"算法:子夏传以数学递减法规定五服绖带尺寸,从首绖九寸逐级推至缌麻之带,是礼制文献中罕见的精密数值体系
  3. 郑注"纯"字两解:或为丝或为色,随文释义,反映古文字通假复杂性
  4. 摄盛制度有刚性边界:士大夫可摄盛(亲迎用助祭之服),但天子诸侯"为尊则衮矣,不须摄盛"
  5. 贾疏以汉制况古制:多处出现"今小吏冠""今冠箱""今偃领"等,为汉代服饰制度保留了珍贵信息
  6. 衣冠同色通例:礼之通例衣与冠同色、裳与韠同色、屦与裳同色,是先秦服色制度的基本法则

踩坑记录

  1. 词库路径变更:原路径/home/z/my-project/skills/rysxguji/references/fushi-keywords.md不存在,实际在/home/z/my-project/upload/rysxguji0518/rysxguji/references/fushi-keywords.md,需glob搜索
  2. 大文件禁忌:892KB文件严禁整本载入Read工具,所有内容提取均通过grep+sed完成
  3. 丧服篇位置:丧服经传在卷23-29(行2368起),非卷20-22(那几卷是聘礼),需精确定位
  4. "衣"字误命中:书中"衣"字极高频但几乎全在服饰语境,因为仪礼注疏本身就以服制为核心,排除规则几乎不需启用

审核结果

全部通过 ✅ - 所有原文均从源文件grep+sed提取,有明确行号对应 - 服饰关键词严格按词库执行 - 排除规则已审查,误命中率极低 - 三份MD文件每篇均≤20KB