《人事典·贵贱部》服饰内容提取 · 操作日志
时间:2026-04-19
任务:从《古今图书集成·人事典·贵贱部》中提取服饰相关内容
输入:/home/z/my-project/upload/part2_extracted/人事典贵贱部.txt
输出:/home/z/my-project/upload/p2output/人事典贵贱部/
操作流程
Step 1: 文件检查
wc -c 人事典贵贱部.txt → 5,855 字节(远≤20KB,安全读取)
- 文件共17行,内容为贵贱部杂录、纪事、总论、艺文四个板块
- 无需分块,可全文处理
Step 2: 55个服饰关键词grep检索
关键词列表:
衣 裳 服 冕 冠 弁 帻 巾 帽 履 屦 舄 鞋 靴 袜 带 绶 佩 笏
裘 袍 襦 衫 袄 褐 裙 裤 褶 裲裆 深衣 褖衣 翟衣 鞠衣 襕衫
幞头 貂蝉 金带 紫袍 绯衣 青衣 朱衣 白衣 玄衣 黄衣 布衣
丝 帛 绢 绸 缎 锦 绫 罗 纱 葛
grep结果(命中11个关键词):
| 关键词 | 匹配数 | 行号 |
|--------|--------|------|
| 衣 | 1 | 9 |
| 服 | 1 | 9 |
| 冠 | 2 | 6, 9 |
| 帽 | 1 | 9 |
| 带 | 1 | 9 |
| 袍 | 1 | 9 |
| 貂蝉 | 1 | 9 |
| 金带 | 1 | 9 |
| 紫袍 | 1 | 9 |
| 帛 | 1 | 12 |
| 罗 | 1 | 10 |
未命中关键词(44个):
裳 冕 弁 帻 巾 履 屦 舄 鞋 靴 袜 绶 佩 笏 裘 襦 衫 袄 褐 裙 裤 褶 裲裆 深衣 褖衣 翟衣 鞠衣 襕衫 幞头 绯衣 青衣 朱衣 白衣 玄衣 黄衣 布衣 丝 绢 绸 缎 锦 绫 纱 葛
Step 3: 逐条验证——剔除伪匹配
| 关键词 | 原文片段 | 判定 | 原因 |
|---|---|---|---|
| 衣 | 一人衣冠熟睡草间 | ✅ 真匹配 | "衣冠"=服饰+冠帽 |
| 服 | 服医朱岩药 | ❌ 伪匹配 | "服"为服用药物 |
| 冣(line6) | 鹖冠子 | ❌ 伪匹配 | 书名/人名 |
| 冠(line9) | 衣冠熟睡 | ✅ 真匹配 | 与"衣"同属一处 |
| 帽 | 脱帽相之 | ✅ 真匹配 | 脱帽=摘帽 |
| 带 | 紫袍金带 | ✅ 真匹配 | 金带=腰带 |
| 袍 | 紫袍金带 | ✅ 真匹配 | 紫袍=官袍 |
| 貂蝉 | 貂蝉喜甚 | ✅ 边缘匹配 | 冠饰代称→官职 |
| 金带 | 紫袍金带 | ✅ 真匹配 | 与袍/带同处 |
| 紫袍 | 紫袍金带 | ✅ 真匹配 | 与袍/带同处 |
| 帛 | 谷帛之利 | ✅ 真匹配 | 帛=丝织品财物 |
| 罗 | 罗隐两同书 | ❌ 伪匹配 | 罗为姓氏 |
验证结论:11个命中→剔除3个伪匹配→实际服饰相关8个关键词,合并同出处后为5处独立内容。
Step 4: 输出三份文件
| 文件 | 内容 |
|---|---|
| 人事典贵贱部_原文提取.md | 5处原文+注释+伪匹配表 |
| 人事典贵贱部_总结.md | 分类总结+核心发现 |
| 人事典贵贱部_日志.md | 本文件 |
关键发现
- 本文无服饰制度明文:贵贱部论德论命,不涉及衣裳规制
- 服饰仅作贵贱叙事点缀:紫袍金带、貂蝉冠、衣冠、脱帽、谷帛均为贵贱故事的次要元素
- 最有价值信息:"紫袍金带锡之"明确记录唐代三品官服制度
- 服饰信息密度极低:5,855字中仅5处沾边,占比<0.1%
关键踩坑记录
- "服"字陷阱:古文中"服"常取"服用""服从"义,非必为服饰。本篇"服医朱岩药"即服药
- "冠"字陷阱:line6"鹖冠子"为战国哲学家及书名,与冠服无关
- "罗"字陷阱:line10"罗隐"为唐末诗人姓氏,非丝织品罗
- "貂蝉"需辨析:此词既可指冠饰,也可指人/官职。本篇3处均指人(侍中王贻永),但溯源仍为冠饰
审核结果
全部通过 ✅
- 原文均从grep检索结果中提取,有明确行号对应
- 伪匹配已标注并剔除
- 无整本TXT加载,文件5,855字节远低于20KB限制