《人事典·贵贱部》服饰内容提取 · 操作日志

时间:2026-04-19
任务:从《古今图书集成·人事典·贵贱部》中提取服饰相关内容
输入:/home/z/my-project/upload/part2_extracted/人事典贵贱部.txt
输出:/home/z/my-project/upload/p2output/人事典贵贱部/


操作流程

Step 1: 文件检查

wc -c 人事典贵贱部.txt → 5,855 字节(远≤20KB,安全读取)

Step 2: 55个服饰关键词grep检索

关键词列表:

衣 裳 服 冕 冠 弁 帻 巾 帽 履 屦 舄 鞋 靴 袜 带 绶 佩 笏 
裘 袍 襦 衫 袄 褐 裙 裤 褶 裲裆 深衣 褖衣 翟衣 鞠衣 襕衫 
幞头 貂蝉 金带 紫袍 绯衣 青衣 朱衣 白衣 玄衣 黄衣 布衣 
丝 帛 绢 绸 缎 锦 绫 罗 纱 葛

grep结果(命中11个关键词):
| 关键词 | 匹配数 | 行号 |
|--------|--------|------|
| 衣 | 1 | 9 |
| 服 | 1 | 9 |
| 冠 | 2 | 6, 9 |
| 帽 | 1 | 9 |
| 带 | 1 | 9 |
| 袍 | 1 | 9 |
| 貂蝉 | 1 | 9 |
| 金带 | 1 | 9 |
| 紫袍 | 1 | 9 |
| 帛 | 1 | 12 |
| 罗 | 1 | 10 |

未命中关键词(44个):
裳 冕 弁 帻 巾 履 屦 舄 鞋 靴 袜 绶 佩 笏 裘 襦 衫 袄 褐 裙 裤 褶 裲裆 深衣 褖衣 翟衣 鞠衣 襕衫 幞头 绯衣 青衣 朱衣 白衣 玄衣 黄衣 布衣 丝 绢 绸 缎 锦 绫 纱 葛

Step 3: 逐条验证——剔除伪匹配

关键词 原文片段 判定 原因
一人衣冠熟睡草间 ✅ 真匹配 "衣冠"=服饰+冠帽
服医朱岩药 ❌ 伪匹配 "服"为服用药物
冣(line6) 鹖冠子 ❌ 伪匹配 书名/人名
冠(line9) 衣冠熟睡 ✅ 真匹配 与"衣"同属一处
脱帽相之 ✅ 真匹配 脱帽=摘帽
紫袍金带 ✅ 真匹配 金带=腰带
紫袍金带 ✅ 真匹配 紫袍=官袍
貂蝉 貂蝉喜甚 ✅ 边缘匹配 冠饰代称→官职
金带 紫袍金带 ✅ 真匹配 与袍/带同处
紫袍 紫袍金带 ✅ 真匹配 与袍/带同处
谷帛之利 ✅ 真匹配 帛=丝织品财物
罗隐两同书 ❌ 伪匹配 罗为姓氏

验证结论:11个命中→剔除3个伪匹配→实际服饰相关8个关键词,合并同出处后为5处独立内容。

Step 4: 输出三份文件

文件 内容
人事典贵贱部_原文提取.md 5处原文+注释+伪匹配表
人事典贵贱部_总结.md 分类总结+核心发现
人事典贵贱部_日志.md 本文件

关键发现

  1. 本文无服饰制度明文:贵贱部论德论命,不涉及衣裳规制
  2. 服饰仅作贵贱叙事点缀:紫袍金带、貂蝉冠、衣冠、脱帽、谷帛均为贵贱故事的次要元素
  3. 最有价值信息:"紫袍金带锡之"明确记录唐代三品官服制度
  4. 服饰信息密度极低:5,855字中仅5处沾边,占比<0.1%

关键踩坑记录


审核结果

全部通过 ✅
- 原文均从grep检索结果中提取,有明确行号对应
- 伪匹配已标注并剔除
- 无整本TXT加载,文件5,855字节远低于20KB限制