总结日志原文提取

《大戴礼记》服饰内容提取·日志

时间:2026-03-04 任务ID:L10-Book2 全书:2411行(大文件,禁止整本载入)


操作流程

Step 1: wc统计

2411 行 /home/z/my-project/upload/礼经_extracted/礼经/大戴礼记.txt

Step 2: 读取词库

同Book 1,路径:/home/z/my-project/upload/rysxguji0518/rysxguji/references/fushi-keywords.md

Step 3: 三轮grep

第1轮:核心服饰词

命中93行
关键命中(经审查保留):
- Line 37: "公冠"(篇目名)
- Line 67: "章甫句屦绅带而搢笏""端衣玄裳冕而乘路""斩衰菅屦"
- Line 69: "黼黻""冕而亲迎"
- Line 71: "麻冕""丧服之先散带"
- Line 113: "冠子取妇之时也"
- Line 178: "妇人未嫁者衣之"(与夏小正同条)
- Line 191: "衣裘之时也"(同上)
- Line 236-237: "端冕""冕服之正"
- Line 267-268: "太子既冠""王既冠"
- Line 337: "冠带衣服不以制"
- Line 387: "佩玉""双衡""双璜"
- Line 399-400: "巾车"
- Line 470: "解衣被髪"
- Line 582: "法服"
- Line 806: "冠娶"
- Line 915: "布衣不完"
- Line 1067: "端冕奉书"
- Line 1077-1102: 带铭、履屦铭、剑铭
- Line 1219-1222: 屦礼
- Line 1290: "黄黼黻衣大带黼裳"
- Line 1310: "百姓藏布帛"
- Line 1400: "工女必自择丝麻"
- Line 1425: "冕而前旒""絖塞耳"
- Line 1594-1598: "衣冠""甲胄""裘服""袍褐"
- Line 1816: 司服六冕+命妇服饰(最重要条目)
- Line 1827-1859: "奉衣服""玄服"
- Line 2147: 朝聘冕服五等制度
- Line 2178: 缁布冠、鞸、芾、革带
- Line 2188: 冠礼制度
- Line 2361-2399: 蚕桑

第2轮:制度动作词

命中2行:
- Line 2188: "冠礼"(士冠礼记)
- Line 2198: "冠礼"(天子元子冠礼)

第3轮:组合扩展词——蚕桑纺织

命中:
- Line 125: "摄桑急桑"
- Line 130: "妾子始蚕"
- Line 291: "玉缫"(玉藻异文)
- Line 1426: "缫瑱"(冕饰)
- Line 2147: "缫借"(圭饰)
- Line 2178: "玉缫"(冠礼文献)
- Line 2361-2362: "蚕食而不饮"
- Line 2399: "食桑者有丝而蛾"

Step 4: 审查排除

原始命中 语境 判定
Line 4, 14 "赏帛" 进书邀赏 ❌ 排除
Line 172, 199 "织女" 星名 ❌ 排除
Line 686 "履虎" "履虎尾"比喻 ❌ 排除——动词义
Line 852 "蓬生麻中" "麻"非衣料语境 ❌ 排除
Line 1032 "麻麦菽" 五谷之一 ⚠️ 保留——麻为衣料来源
Line 1016 "丝竹" 乐器材质 ❌ 排除——非衣料
Line 2070-2072 "履" 汤名 ❌ 排除——人名
Line 1077 "于机为铭" 织机 ❌ 排除——非服饰
Line 291, 296 "玉缫" 玉藻篇名/佩玉串 ⚠️ 保留——佩饰

Step 5: sed提取

大文件,使用python3按行号提取关键片段,已获取Line 67, 1816, 2178, 1290等核心段落。

Step 6: 分类

Step 7-8: 参考与创作

已读取参考文件,创作三份MD。


关键踩坑

  1. 大文件处理:2411行,UTF-8编码问题导致sed截断,改用python3读取
  2. "履"字多重含义:人名(商汤名履)、动词(履虎)、足服(履屦之铭)需逐一区分
  3. "麻"字语境判断:五谷之麻(保留)vs 蓬生麻中(排除)
  4. Line 1816为全书最重条目:兼含六冕制+命妇服+祭服差异+郑玄批判,信息量极大
  5. "缫"字非纺织义:玉缫/缫借为佩玉丝带,缫瑱为冕饰,与蚕桑缫丝无关

审核结果

全部通过 ✅ — 93行初始命中经审查保留约40条有效服饰内容,排除项已逐一判定。