《人事典·患难部》服饰内容提取 · 操作日志
时间:2026-04-19
任务:从《古今图书集成·人事典·患难部》中提取服饰相关内容
文件:/home/z/my-project/upload/part2_extracted/人事典患难部.txt(51,216字节,234行)
操作流程
Step 1: 读取参考文件
读取 /home/z/my-project/upload/参考/ 下三份文件:
- 总结.md(吕氏春秋服饰汇编)
- 日志.md(晋会要提取操作记录)
- 原文提取.md(天工开物服饰原文提取)
→ 明确输出格式:总结/日志/原文提取三份MD
Step 2: 检查输入文件
wc -c → 51,216 字节
wc -l → 234 行
head -5 → 患难部总论 / 易经 / 坎卦
→ 文件不大(≤51KB),但按要求不加载整本,仅grep搜索
Step 3: 55个服饰关键词grep检索
关键词列表(55个):
衣、裳、冠、冕、弁、帻、巾、帽、履、舄、靴、鞋、袜、佩、绶、带、鞶、笏、袍、裘、褐、衫、褂、裙、裤、袴、襦、袄、铠、甲、盔、胄、旒、黼、黻、绣、锦、罗、纱、绢、绸、缎、帛、丝、麻、葛、絺、绤、缟、布、纬、纩、袂、裾、衿、领、袖
逐字检索结果(命中数>0):
| 关键词 | 命中行数 | 判定 |
|---|---|---|
| 衣 | 5 | ✅ 服饰相关 |
| 裳 | 2 | ✅ 服饰相关(颠倒衣裳、无缘之裳) |
| 冕 | 1 | ✅ 服饰相关(去冕兮为奴) |
| 巾 | 1 | ❌ 非服饰("黄巾"指起义军名) |
| 履 | 5 | ❌ 非服饰(履=踩踏:履重险、履德之基、履义、履腹) |
| 鞋 | 2 | ✅ 服饰相关(麻鞋、鞋袜破尽) |
| 袜 | 1 | ✅ 服饰相关(鞋袜破尽) |
| 袍 | 1 | ✅ 服饰相关(脱袍、衣袍换升米) |
| 褐 | 1 | ✅ 服饰相关(衣褐兮为婢、髡钳布衣褐) |
| 襦 | 1 | ✅ 服饰相关(左关之襦) |
| 甲 | 1 | ❌ 非服饰(甲士=兵士,以甲千列=甲兵,甲辰/甲戌=干支) |
| 旒 | 1 | ✅ 服饰相关(前旒=冕冠垂饰) |
| 罗 | 1 | ❌ 非服饰(雉离于罗=罗网) |
| 绸 | 1 | ❌ 非服饰(拘于绸=绸缪,束缚之意) |
| 帛 | 1 | ⚠️ 边缘(玉帛与珠玑=财宝,帛为丝织品但作财物用) |
| 丝 | 1 | ❌ 非服饰(走青丝=黑色缰绳/发,非丝织品服饰) |
| 麻 | 1 | ✅ 服饰相关(麻鞋见天子) |
| 葛 | 5 | ❌ 非服饰(困于葛藟=藤蔓,葛虆=葛藤,怀葛=古帝王名) |
| 布 | 2 | ✅ 服饰相关(布衣之友、髡钳布衣褐) |
| 袖 | 1 | ✅ 服饰相关(衣袖露两肘) |
未命中关键词(34个):
弁、帻、帽、舄、靴、佩、绶、带、鞶、笏、裘、衫、褂、裙、裤、袴、袄、铠、盔、胄、黼、黻、绣、锦、纱、绢、缎、絺、绤、缟、纬、纩、裾、衿、领
Step 4: 甄别与提取
对每个命中的行进行上下文审查,区分:
- 服饰用法:衣物本身或穿用行为(衣褐、麻鞋、犊鼻、裳、襦等)
- 非服饰用法:词语借用或引申(履=行走、罗=网、葛=藤蔓等)
最终确认 16处 服饰相关内容。
Step 5: 创建输出目录
mkdir -p /home/z/my-project/upload/p2output/人事典患难部/
Step 6: 撰写三份MD
- 总结.md:分类梳理、核心发现
- 日志.md:本文件
- 原文提取.md:逐条原文摘录
关键发现
- 《人事典·患难部》服饰密度极低:全文234行约5万字,仅16处服饰内容,且全部为叙事附带,无制度性记载
- 最核心的服饰描写在吴越春秋:越王勾践入臣于吴一段,含4种具体服饰(犊鼻、樵头、无缘裳、左关襦),为全典最详细
- 唐代逃难诗服饰描写最生动:杜甫"麻鞋见天子,衣袖露两肘"、洪若皋"颠倒衣裳""衣袍换升米"
- "布衣"出现3次:均为"平民"引申义,非实物描写
踩坑记录
- "履"字5次命中全部为"行走"义:履德之基、履重险、修德履义、履腹涉尸——无一处为鞋履义
- "葛"字5次命中全部为"藤蔓"义:困于葛藟、葛虆、怀葛——无一处为葛布义
- "甲"字命中但为甲兵/干支:甲士、以甲千列、甲辰、甲戌——无一处为铠甲服饰义
- "绸"字为"绸缪"义:拘于绸——束缚,非丝绸
- "罗"字为罗网义:雉离于罗——捕鸟网,非丝罗
- "丝"字为缰绳义:走青丝——黑色缰绳,非丝织品
审核结论
全部16处服饰内容均经grep -n定位行号后逐条验证,确保:
1. ✅ 原文确实出自《人事典·患难部》
2. ✅ 关键词在上下文中为服饰用法
3. ✅ 每篇提取原文≤20KB(本文总提取量约4KB,远低于限制)
4. ✅ 排除了所有非服饰用法的误判