《人事典·睡部》服饰内容提取 · 操作日志
时间:2026-04-19
任务:从《人事典·睡部》提取服饰相关内容,产出三份MD
操作流程
Step 1: 检查文件
文件:/home/z/my-project/upload/part2_extracted/人事典睡部.txt
大小:25,779字节(>20KB,严禁加载整本)
行数:51行
编码:UTF-8 with CRLF,极长行(最长3547字符)
Step 2: 读取参考模板
读取 /home/z/my-project/upload/参考/ 目录
- 总结.md(参考《吕氏春秋》总结格式)
- 日志.md(参考《晋会要》日志格式)
- 原文提取.md(参考《天工开物》原文提取格式)
Step 3: 55个服饰关键词grep检索
关键词列表(55个):
衣 裳 冠 冕 裘 褐 袍 裙 裤 履 鞋 袜 带 佩 笏 绶 玺 旂 旗 旌 幢 盖 伞 帻 巾 帽 弁 缨 簪 钗 环 珰 笄 袂 衿 裾 襟 领 袖 绮 绫 罗 缎 绢 绸 纱 缟 锦 绣 帛 丝 麻 葛 布 袈
初始命中结果(20个关键词有命中):
- 衣: 5处
- 裳: 2处
- 冠: 4处
- 褐: 1处
- 袍: 1处
- 带: 1处
- 佩: 1处
- 绶: 1处
- 盖: 3处
- 巾: 2处
- 帽: 1处
- 弁: 1处
- 襟: 1处
- 领: 1处
- 绫: 1处
- 罗: 1处
- 纱: 1处
- 丝: 2处
- 葛: 1处
- 布: 1处
未命中(35个):
冕 裘 裙 裤 履 鞋 袜 笏 玺 旂 旗 旌 幢 伞 帻 缨 簪 钗 环 珰 笄 袂 衿 裾 袖 绮 缎 绢 绸 缟 锦 绣 帛 麻 袈
Step 4: 假阳性甄别
对20个初始命中逐项验证,排除6个假阳性:
1. 盖(3处): 全部为连词"盖……也"(因为/大概),非伞盖 → 排除
- "盖老人之常态"(line30)→ 连词
- "盖初奏上"(line17)→ 连词
- "盖夫子恶其"(line30)→ 连词
2. 丝(2处): 非丝织品含义 → 排除
- "按之丝竹皆合古奏"(line17)→ 丝竹=乐器
- "梦逐游丝自在飞"(line46)→ 游丝=飘浮细丝
3. 葛(1处): 非葛布含义 → 排除
- "葛长庚"(line46)→ 人名(南宋道士葛长庚)
4. 绶(1处): 非丝绶含义 → 排除
- "韦绶"(line17)→ 人名(唐翰林学士韦绶)
5. 弁(1处): 非冠弁含义 → 排除
- "小弁篇"(line24)→ 《诗经·小弁》篇名
6. 领(1处): 非衣领含义 → 排除
- "约领屯骑校尉"(line17)→ 领=兼任/统率
额外排除:
- "被衣"(line17):人名(被衣者尧时人也),非衣物
- "冠绝当时"(line17):冠=超越,非冠帽
有效命中:14个关键词
衣 裳 冠 褐 袍 带 佩 巾 帽 襟 绫 罗 纱 布
Step 5: 扩展搜索
针对睡部特殊用词补充搜索:
- 屦: 1处(line44→黄草屦)
- 裀: 1处(line44→重裀衬枕)
- 毡: 1处(line45→青毡)
- 褥: 2处(line45→腰褥)
- 被褥: 1处(line17→被褥诈熟眠)
- 衾: 1处(line50→衾裯)
- 裯: 1处(line50→衾裯)
- 帷: 1处(line44→帷屏不复张)
- 屏: 多处(line44帷屏/line45短屏风等)
- 帐: 3处(line17帐中眠/line45帐垂空翠/line45归帐)
- 幕: 2处(line44夹幕/line45帘幕底)
- 帘: 2处(line45帘卷/line45隔帘栊)
Step 6: 分类整理
从grep命中结果中提取服饰相关原文,按主题分为10类:
1. 衣冠与就寝(不解衣冠、衣冠而出)
2. 合衣寝(和衣而眠)
3. 衣裳更替(服衣裳、更衣、解衣)
4. 冠冕(武冠、尘冠、冠佩捐)
5. 巾帽(脱巾、纱巾、乌帽)
6. 袍(蜀缬袍)
7. 褐与衣(敝褐、白单衣、罗衣)
8. 绫与裳(缭绫、绫腰褥、下裳红)
9. 带(解带对卧)
10. 寝具与布被(布被、帷屏、衾裯)
Step 7: 保存三份文件
- 人事典睡部_总结.md
- 人事典睡部_原文提取.md
- 人事典睡部_日志.md(本文件)
关键发现
- 服饰信息密度极低:全书25,779字节,仅14/55个关键词有效命中,假阳性率30%(6/20),实际服饰相关内容约600字
- 无独立服饰论述:所有服饰内容依附于睡事叙述与咏睡诗歌,属于间接记载
- 诗歌为主要载体:服饰描写集中在唐宋诗歌中(白居易7处、韩偓3处、杜牧2处),叙事类文字极少
- "蜀缬袍"最值得关注:涉及唐代四川名贵染花丝织品,为全书唯一具体的丝织品名物
- 冠帽类最丰富:武冠、尘冠、纱巾、乌帽,反映古人睡前卸冠的日常习惯
- "下裳红"为唯一裙裳描写:韩偓诗"解衣唯见下裳红",唐诗中女性服饰描写典型
- 寝具词汇丰富:布被、帷屏、衾裯、青毡、绫腰褥、夹幕、帘幕等,与睡眠主题一致
关键踩坑记录
- "被衣"为古代人名(尧时隐士),非"被覆衣裳"之意,最易误判
- "冠绝当时"中"冠"为动词"超越",非冠帽,需人工甄别
- "盖"字3处命中全部为连词,非伞盖/车盖,假阳性典型
- "丝竹"指乐器,"游丝"指蛛丝,均非丝织品含义
- "葛长庚"为人名,非葛布;"韦绶"为人名,非丝绶
- "小弁"为《诗经》篇名,非冠弁
- "领屯骑校尉"中"领"为动词"兼任",非衣领
- 文本行数仅51行但行极长(最长3547字符),grep结果难以定位具体段落
- 部分字符为□(OCR缺失),如"□绫腰褥"中的绫前字缺失
审核结果
全部通过 ✅ — 原文均从grep结果中提取,有明确行号对应。55个关键词逐一检索,初始命中20个,经甄别排除6个假阳性,有效命中14个,扩展搜索补充8项寝具/陈设词汇。全书服饰内容稀少,与"睡部"主题一致。