《人事典·脏腑部》服饰内容提取 · 操作日志
时间:2026-04-20
任务:从《人事典·脏腑部》提取服饰相关内容,产出三份MD
操作流程
Step 1: 读取参考模板
读取 /home/z/my-project/upload/参考/ 下的三份MD模板:
- 总结.md(吕氏春秋)—— 主题分类式总结
- 日志.md(晋会要)—— 操作流程记录
- 原文提取.md(天工开物)—— 按原文段落提取
Step 2: 检查输入文件
文件:/home/z/my-project/upload/part2_extracted/人事典脏腑部.txt
大小:59,215字节(~58KB)
行数:209行(每行极长,为古籍段落式排版)
首行:脏腑部汇考 → 灵枢·本脏
性质:古今图书集成·人事典·脏腑部,医学典籍汇编
Step 3: 55关键词批量grep
关键词列表(55个):
冠、冕、弁、帻、巾、帽、盔、笄、簪、钗
衣、裳、袍、裘、褐、衫、襦、袂、裙、袴
绶、带、革带、佩、玉佩、笏、蔽膝、舄、屦、履
鞋、袜、锦、绮、绫、罗、缎、绢、纱、帛
丝、麻、葛、布、绣、黼、黻、衮、袈裟、道袍
朝服、祭服、丧服、戎服、常服
Step 4: 命中统计
【冠】命中1处 → "鸡冠色"(假阳性:鸡冠非冠帽)
【弁】命中1处 → 上下文为职官词
【衣】命中4处 → 逐条核查
【褐】命中1处 → "衣褐"(正条:僧衣)
【带】命中1处 → "衣带"(正条:衣带)
【佩】命中1处 → "佩刀"(假阳性:佩带兵器)
【履】命中1处 → "履其肝"(假阳性:践踏)
【罗】命中3处 → "罗膈""罗络"(假阳性:解剖词)
【丝】命中3处 → "筋膜如丝""丝竹空"(假阳性:解剖/穴位)
【麻】命中1处 → "麻谷"(假阳性:谷物)
【葛】命中1处 → "诸葛亮"(假阳性:人名)
【布】命中10处 → "分布""宣布"等(假阳性:动词"散布")
【袈裟】命中1处 → 正条:僧人袈裟
其余42个关键词 → 零命中
Step 5: 逐条上下文核查
对13个命中关键词逐条调取原文上下文:
- rg -n "关键词" 人事典脏腑部.txt
- 判定每个命中是否为 genuine 服饰用法
判定结果:
- 假阳性:8个关键词(冠、弁、佩、履、罗、丝、麻、葛、布)共22处
- 正条:5处 genuine 服饰提及
Step 6: 创建输出目录与三份MD
mkdir -p /home/z/my-project/upload/p2output/人事典脏腑部/
写入:
1. 人事典脏腑部_总结.md —— 结论+5条附注+假阳性排除+总体评价
2. 人事典脏腑部_日志.md —— 本文件
3. 人事典脏腑部_原文提取.md —— 5处原文上下文
关键发现
- 本书无服饰内容:作为脏腑学医学汇编,全书以五脏六腑形态、病候、典故为主,与服饰制度毫无交集
- 5处附带提及均为叙事或诊法中的偶然出现,无制度性、礼制性、工艺性服饰信息
- 假阳性率极高:13个关键词命中共约30处,其中22处为假阳性(73%),主要因医学文本中大量使用"分布""罗络""丝脉"等与服饰同形异义词语
- "衣"字4处命中中仅3处为 genuine("应衣""温衣""衣褐/整其衣"),1处"衣带"也在正条中
关键踩坑记录
- "布"字陷阱:10处命中全为"分布""宣布""散布"等动词用法,无一为布帛之布。医学文本中"布"作动词极常见
- "罗"字陷阱:3处命中中"罗膈"(横膈膜)为解剖术语,"罗络"为网络状描述,均非丝织品
- "丝"字陷阱:中医描述细筋膜常用"如丝"比喻,穴位名"丝竹空"含"丝",均非丝帛
- "冠"字陷阱:"鸡冠色"形容心脏色泽,为中医望诊比喻,非冠帽
- "履"字陷阱:"履其肝"为践踏义,非鞋履
- 长行问题:全书209行但每行极长(平均~280字/行),grep命中后需人工定位关键词在行内位置
审核结论
经55关键词全覆盖grep + 逐条上下文核查,确认《人事典·脏腑部》无实质性服饰内容。5处附带提及已全部提取并注释,假阳性已逐一排除。