《别本十六国春秋》服饰内容提取 — 操作日志
操作时间:2026-05-04 18:01
操作者:AI Subagent
输入文件:载记/别本十六国春秋.txt(317行,124,071字节)
操作流程
Step 1: 读取参考模板
读取了3个模板文件:
- 参考/总结.md —— 以《吕氏春秋》为例的服饰综述格式
- 参考/日志.md —— 以《警世通言》为例的操作日志格式
- 参考/原文提取.md —— 以《天工开物》为例的原文提取格式
Step 2: 文件统计
wc -l: 317行
wc -c: 124,071字节
文件规模较小,每行极长(平均每行约391字),为典型的古籍电子文本格式。
Step 3: 多轮grep提取
3.1 第一轮:基础服饰关键词(逐个grep -c统计)
| 关键词 | 命中行数 | 关键词 | 命中行数 |
|---|---|---|---|
| 衣 | 6 | 裳 | 1 |
| 袍 | 0 | 衫 | 0 |
| 裙 | 0 | 袄 | 0 |
| 裤 | 0 | 袜 | 0 |
| 鞋 | 0 | 履 | 1 |
| 靴 | 0 | 冠 | 11 |
| 帽 | 0 | 巾 | 1 |
| 笄 | 0 | 簪 | 0 |
| 钗 | 0 | 环 | 1 |
| 佩 | 1 | 带 | 4 |
| 绶 | 2 | 裘 | 0 |
| 葛 | 5 | 麻 | 2 |
| 丝 | 1 | 绢 | 1 |
| 锦 | 0 | 绮 | 1 |
| 绫 | 0 | 罗 | 7 |
| 缎 | 0 | 纱 | 0 |
| 绸 | 0 | 布 | 3 |
| 棉 | 0 | 绒 | 0 |
| 褐 | 0 | 毡 | 1 |
| 染 | 0 | 绣 | 0 |
| 织 | 0 | 蚕 | 1 |
| 茧 | 1 | 帛 | 2 |
| 素 | 9 | 缟 | 1 |
| 絺 | 0 | 纁 | 0 |
| 黻 | 0 | 黼 | 0 |
3.2 第二轮:复合关键词
| 关键词 | 命中行数 |
|---|---|
| 舆服 | 1 |
其余复合关键词(章服、服色、品色、冠服、赐服、赐紫、借紫、服紫、服绯、补服、龙袍、凤冠、霞帔、抹额、璎珞、禁步、玉佩、鱼袋、头戴、身穿、脚穿、着衣、穿衣、衣青、衣朱、衣黄、衣白、衣黑、衣玄)均未命中。
3.3 命中行号汇总(grep -n提取)
grep -n "衣|裳|履|冠|巾|环|佩|带|绶|葛|麻|丝|绢|罗|绮|素|缟|帛|布|毡|蚕|茧|舆服" 别本十六国春秋.txt
命中行号:25, 27, 29, 50, 52, 54, 66, 68, 70, 92, 94, 96, 98, 100, 102, 109, 115, 129, 133, 135, 139, 156, 182, 190, 202, 213, 219, 248, 293
Step 4: sed提取上下文
对关键行号使用grep -oP提取服饰相关上下文片段,每个关键词前后各30-40字。
Step 5: 精简筛选
去除的噪音行:
- 罗出现7次,但大多为人名(罗尚、罗氏、鸠摩罗什),非服饰内容 → 仅保留相关语境
- 葛出现5次,多为地名(葛陂)或人名 → 未发现实际葛布服饰内容
- 麻出现2次,一处为"沤麻池"(地名),一处为"麻秋"(人名) → 无实际麻布服饰内容
- 带出现4次,多为"携带"之带 → 仅保留"腰带十四围""武冠带绶"等服饰义
- 环出现1次,为"步摇环" → 保留
- 佩出现1次,为"佩刀" → 保留(武器配件)
- 丝出现1次,为"金石丝竹" → 保留(乐器相关)
- 绢出现1次,为"绢五十匹" → 保留(丝织品赏赐)
- 巾出现1次,为"城巾"相关 → 去除(非服饰义)
- 帛出现2次,为"玉帛"、"币帛" → 保留
- 绮出现1次,为"服绮谷" → 保留
- 素出现9次,多为"素服""素车""缟素""儒素"等 → 保留(均与服饰相关)
- 毡出现1次,为"鞾中有毡" → 保留
最终保留的有效服饰段落:
- 冠服制度(4处):进贤冠+武冠、步摇冠、朱衣赤冠、车服旌旂
- 衣裳描写(10处):衣冠华族、服绮谷、褰衣、污服失冠、衣黒、布衣、儒素、素服、素车白马、腰带
- 戎服甲胄(6处):戎服执戟、贯甲×3、被甲×2
- 织物面料(4处):野蚕茧、杂缯、丝竹、缟素
- 丧葬服饰(4处):裸剥衣裳、服斩绱、襚鞾毡、素舆
Step 6: 对抗式审查
审查方法:
逐一核对总结中每条原文引用,确认其存在于grep结果中。
审查结果:
| 序号 | 总结中引用 | grep验证 | 结果 |
|---|---|---|---|
| 1 | 进贤冠升御座 | 行27命中 | ✓ 通过 |
| 2 | 武冠带绶 | 行27命中 | ✓ 通过 |
| 3 | 冠步摇 | 行66命中 | ✓ 通过 |
| 4 | 朱衣赤冠 | 行98命中 | ✓ 通过 |
| 5 | 车服旌旂一如王者 | 行156命中 | ✓ 通过 |
| 6 | 衣冠华族 | 行50命中 | ✓ 通过 |
| 7 | 服绮谷 | 行54命中 | ✓ 通过 |
| 8 | 褰衣而行 | 行54命中 | ✓ 通过 |
| 9 | 污服失冠 | 行96命中 | ✓ 通过 |
| 10 | 衣黒 | 行98命中 | ✓ 通过 |
| 11 | 布衣之恨 | 行50命中 | ✓ 通过 |
| 12 | 儒素 | 行52命中 | ✓ 通过 |
| 13 | 素服 | 行156命中 | ✓ 通过 |
| 14 | 素车白马 | 行98命中 | ✓ 通过 |
| 15 | 腰带十四围 | 行139命中 | ✓ 通过 |
| 16 | 戎服执戟 | 行27命中 | ✓ 通过 |
| 17 | 贯甲曜兵 | 行54命中 | ✓ 通过 |
| 18 | 身贯甲胄 | 行98命中 | ✓ 通过 |
| 19 | 収发贯甲 | 行219命中 | ✓ 通过 |
| 20 | 妇人被甲 | 行293命中 | ✓ 通过 |
| 21 | 木人被甲罗之垒上 | 行202命中 | ✓ 通过 |
| 22 | 野蚕成茧 | 行94命中 | ✓ 通过 |
| 23 | 杂缯 | 行50命中 | ✓ 通过 |
| 24 | 金石丝竹 | 行98命中 | ✓ 通过 |
| 25 | 三军缟素 | 行202命中 | ✓ 通过 |
| 26 | 裸剥衣裳 | 行102命中 | ✓ 通过 |
| 27 | 服斩绱 | 行219命中 | ✓ 通过 |
| 28 | 鞾中有毡 | 行219命中 | ✓ 通过 |
| 29 | 乘素舆 | 行133命中 | ✓ 通过 |
全部29条引用均通过验证,无虚构内容。
关键发现
- 本书服饰内容密度较低——317行文本中有效服饰段落仅约30处,平均每10行约1处
- 戎服甲胄是最主要的服饰内容——十六国为战乱时代,军事服饰描写占近1/3
- 冠饰记载有独特的民族史价值——慕容氏冠步摇得姓的记载是民族服饰融合的经典案例
- 缺乏织染工艺记载——与《天工开物》不同,本书无染色、纺织技术描写
- 无首饰类记载——笄、簪、钗、环等首饰关键词基本未命中(环仅1处为步摇环)
- 丧葬服饰记载较丰富——裸剥、斩绱、缟素、素车白马等反映当时的丧礼制度
保存文件
| 文件 | 路径 |
|---|---|
| 总结 | 载记output/别本十六国春秋/别本十六国春秋_总结.md |
| 日志 | 载记output/别本十六国春秋/别本十六国春秋_日志.md |
| 原文提取 | 载记output/别本十六国春秋/别本十六国春秋_原文提取.md |