《青箱杂记》服饰内容提取日志
任务ID: batch6-3 书名:《青箱杂记》 操作时间:2026-04-19 操作者:rysxguji子Agent
一、文件信息
| 项目 | 值 |
|---|---|
| 输入文件 | /home/z/my-project/upload/part4/青箱杂记.txt |
| 文件大小 | 194,583 字节(约190KB) |
| 行数 | 993 行 |
| 输出目录 | /home/z/my-project/upload/4笔记output/青箱杂记/ |
| 书籍朝代 | 北宋 |
| 作者 | 吴处厚 |
| 体裁 | 笔记 |
二、操作流程
Step 1: 读取参考文件
已读取4份参考文件: - fushi-keywords.md(服饰关键词词库) - 总结.md(参考样例:《吕氏春秋》) - 日志.md(参考样例:《晋会要》) - 原文提取.md(参考样例:《天工开物》)
Step 2: 检查输入文件
- 文件大小190KB,<500KB,可安全grep
- 行数993行,属于中等规模笔记
- 无需分段处理
Step 3: 第1轮搜索——核心服饰词
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|……' 青箱杂记.txt
命中行数:约45行含服饰关键词(含校勘记重复)
经逐条审查排除误命中: - "麻"→"麻曰"(诏书体裁,非服饰)→排除 - "罗"→"罗列""罗敷"(非丝织品义)→排除 - "佩"→"佩韦弦"(佩戴义,非佩饰本体)→排除 - "服"→"服之无斁"(穿着义,保留)→保留 - "环"→"环卫"(禁卫义,非首饰)→排除 - "领"→"牛领上"(非衣领)→排除 - "带"→"带领""连带""地带"→排除;"重戴""绢带"→保留
Step 4: 第2轮搜索——制度动作词
rg -n '赐服|赐紫|赐绯|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 青箱杂记.txt
命中: - 敛衽(第138行)→非服饰语境(为礼仪动作描述),但保留 - 僭(第26行)→"非僭"在诗中,非服饰制度语境
Step 5: 第3轮搜索——组合扩展词
rg -n '紫方袍|锡服|席帽|重戴|乌帻|乌帽|光纱|南纱|短袴|危脑帽|尖巾|道衣|莲花冠|醉妆|云霞画衣|赭黄衣|缁褐|铁冠|石榴裙|布袍|战袍|金甲|革履|布被|纸帐|短氎|裹帽|梳头|裙布|钗|花钿|霞帔|披帛|绶|笏|鱼袋……' 青箱杂记.txt
补充命中关键段落,确认无遗漏。
Step 6: 上下文提取
对每个命中行号N,用sed提取N-2到N+5行,确认语境完整性。重点提取: - 第121-123行:席帽/重戴/乌帻(连续段落) - 第552-555行:服妖记载(连续段落) - 第671行:紫方袍/锡服 - 第673行:短氎轻绦/布被革履 - 第845行:隐士帽/褐袍绢带 - 其他散见行
Step 7: 撰写三份文件
- 青箱杂记_原文提取.md — 按主题分6大类,提取原文
- 青箱杂记_总结.md — 分类总结+分析+评级
- 青箱杂记_日志.md — 本文件
三、搜索统计
| 搜索轮次 | 搜索范围 | 命中行数 | 经排除后 |
|---|---|---|---|
| 第1轮 | 核心服饰词 | ~45行 | ~25行 |
| 第2轮 | 制度动作词 | 2行 | 1行 |
| 第3轮 | 组合扩展词 | ~20行 | ~15行 |
| 合计 | — | ~67行 | 约14条实质性内容 |
四、关键发现
- 北宋初年士子冠服制度——席帽、重戴、乌帻三段文字构成完整的士子出行服饰链
- 乌帻纱料变迁——天圣前光纱→南纱→复用光纱,六十年流行周期,为宋代帽饰材料史的珍贵记录
- 前蜀王衍服妖——7种服妖(大帽、危脑帽、尖巾、道衣、莲花冠、醉妆、云霞画衣),是五代十国服饰的罕见记载
- 宋代僧官赐服——紫方袍、锡服为朝廷赐僧人的制度性服饰
- 张乖崖自画像——戴隐士帽、褐袍绢带,是宋代士人退隐后服饰选择的实证
五、排除记录
| 关键词 | 原文 | 行号 | 排除理由 |
|---|---|---|---|
| 麻 | "其麻曰:仍复酣醟杯觞" | 129 | "麻"指麻制诏书,非服饰 |
| 罗 | "罗敷" | 651 | 人名,非丝织品 |
| 佩 | "佩韦弦" | 373 | 佩戴义,非佩饰本体 |
| 环 | "环卫" | 485 | 禁卫义,非首饰 |
| 领 | "牛领上" | 25 | 动物颈部,非衣领 |
| 带 | "带领""连带" | 多处 | 动词/连词义,非腰带 |
| 冠 | "冠军""冠绝" | — | 未出现此误命中 |
六、文件大小检查
| 文件 | 大小 | ≤20KB? |
|---|---|---|
| 青箱杂记_总结.md | ~7KB | ✅ |
| 青箱杂记_原文提取.md | ~9KB | ✅ |
| 青箱杂记_日志.md | ~5KB | ✅ |
七、审查结论
- ✅ 所有原文均从TXT文件grep提取,有明确行号对应
- ✅ 排除规则已逐条执行
- ✅ 无虚构内容,无整本载入
- ✅ 三份文件均≤20KB
- ✅ 只处理本书,未混入其他书籍内容