《人事典·脏腑部》服饰内容提取 · 操作日志

时间:2026-04-20
任务:从《人事典·脏腑部》提取服饰相关内容,产出三份MD


操作流程

Step 1: 读取参考模板

读取 /home/z/my-project/upload/参考/ 下的三份MD模板
- 总结.md(吕氏春秋)—— 主题分类式总结
- 日志.md(晋会要)—— 操作流程记录
- 原文提取.md(天工开物)—— 按原文段落提取

Step 2: 检查输入文件

文件:/home/z/my-project/upload/part2_extracted/人事典脏腑部.txt
大小:59,215字节(~58KB
行数:209行(每行极长,为古籍段落式排版)
首行:脏腑部汇考  灵枢·本脏
性质:古今图书集成·人事典·脏腑部,医学典籍汇编

Step 3: 55关键词批量grep

关键词列表(55个):
冠、冕、弁、帻、巾、帽、盔、笄、簪、钗
衣、裳、袍、裘、褐、衫、襦、袂、裙、袴
绶、带、革带、佩、玉佩、笏、蔽膝、舄、屦、履
鞋、袜、锦、绮、绫、罗、缎、绢、纱、帛
丝、麻、葛、布、绣、黼、黻、衮、袈裟、道袍
朝服、祭服、丧服、戎服、常服

Step 4: 命中统计

【冠】命中1处 → "鸡冠色"(假阳性:鸡冠非冠帽)
【弁】命中1处 → 上下文为职官词
【衣】命中4处 → 逐条核查
【褐】命中1处 → "衣褐"(正条:僧衣)
【带】命中1处 → "衣带"(正条:衣带)
【佩】命中1处 → "佩刀"(假阳性:佩带兵器)
【履】命中1处 → "履其肝"(假阳性:践踏)
【罗】命中3处 → "罗膈""罗络"(假阳性:解剖词)
【丝】命中3处 → "筋膜如丝""丝竹空"(假阳性:解剖/穴位)
【麻】命中1处 → "麻谷"(假阳性:谷物)
【葛】命中1处 → "诸葛亮"(假阳性:人名)
【布】命中10处 → "分布""宣布"等(假阳性:动词"散布")
【袈裟】命中1处 → 正条:僧人袈裟

其余42个关键词 → 零命中

Step 5: 逐条上下文核查

对13个命中关键词逐条调取原文上下文:
- rg -n "关键词" 人事典脏腑部.txt
- 判定每个命中是否为 genuine 服饰用法

判定结果:
- 假阳性:8个关键词(冠、弁、佩、履、罗、丝、麻、葛、布)共22处
- 正条:5处 genuine 服饰提及

Step 6: 创建输出目录与三份MD

mkdir -p /home/z/my-project/upload/p2output/人事典脏腑部/
写入:
1. 人事典脏腑部_总结.md —— 结论+5条附注+假阳性排除+总体评价
2. 人事典脏腑部_日志.md —— 本文件
3. 人事典脏腑部_原文提取.md —— 5处原文上下文

关键发现

  1. 本书无服饰内容:作为脏腑学医学汇编,全书以五脏六腑形态、病候、典故为主,与服饰制度毫无交集
  2. 5处附带提及均为叙事或诊法中的偶然出现,无制度性、礼制性、工艺性服饰信息
  3. 假阳性率极高:13个关键词命中共约30处,其中22处为假阳性(73%),主要因医学文本中大量使用"分布""罗络""丝脉"等与服饰同形异义词语
  4. "衣"字4处命中中仅3处为 genuine("应衣""温衣""衣褐/整其衣"),1处"衣带"也在正条中

关键踩坑记录


审核结论

经55关键词全覆盖grep + 逐条上下文核查,确认《人事典·脏腑部》无实质性服饰内容。5处附带提及已全部提取并注释,假阳性已逐一排除。