《非烟传》服饰内容提取 · 操作日志
时间:2026-04-19 任务:提取《非烟传》全部服饰相关内容,整理分类总结 输入:/home/z/my-project/upload/part4/非烟传.txt 输出目录:/home/z/my-project/upload/4笔记output/非烟传/
操作流程
Step 0: 读取参考文件
读取 fushi-keywords.md → 服饰词库(核心词/制度动作词/组合扩展词/排除规则)
读取 参考/总结.md → 《吕氏春秋》总结模板
读取 参考/日志.md → 《晋会要》日志模板
读取 参考/原文提取.md → 《天工开物》原文提取模板
Step 1: 检查输入文件
wc -c 非烟传.txt → 6,226 字节
wc -l 非烟传.txt → 37 行
注:文件极小(<10KB,<100行),但遵守"严禁整本载入大TXT"规则,仍以grep先行定位。
Step 2: 创建输出目录
mkdir -p /home/z/my-project/upload/4笔记output/非烟传/
Step 3: 第1轮搜索——核心服饰词
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 非烟传.txt
命中行:3, 12, 17, 18, 20, 21, 35(共7行,21次命中关键词)
逐条审查:
| 行号 | 关键词 | 原文片段 | 判定 |
|---|---|---|---|
| 3 | 罗 | 若不胜绔罗 | ✅ 保留——丝织品 |
| 3 | 丝 | 其韵与丝竹合 | ❌ 排除——丝竹=乐器 |
| 3 | 衣 | 衣缨之族 | ✅ 保留——衣冠代称 |
| 3 | 缨 | 衣缨之族 | ✅ 保留——冠缨代称 |
| 3 | 冠 | 弱冠矣 | ⚠️ 降级——仅年龄称谓 |
| 3 | 绣 | (无,在后续行) | — |
| 12 | 襟 | 洒幽襟 | ❌ 排除——比喻内心 |
| 17 | 锦 | 连蝉锦香囊 | ✅ 保留——锦缎佩饰 |
| 18 | 妆 | 严妆 | ✅ 保留——妆饰 |
| 18 | 绣 | 倚绣栊 | ❌ 排除——绣花窗格 |
| 18 | 锦 | 蝉锦 | ✅ 保留——同上香囊 |
| 20 | 锦 | 锦囊 | ✅ 保留——同上香囊 |
| 20 | 丝 | 乌丝简 | ❌ 排除——墨书简札 |
| 20 | 襟 | 尘襟 | ❌ 排除——比喻世俗心念 |
| 20 | 履 | 芳履违和 | ❌ 排除——比喻步履 |
| 21 | 锦 | 蝉锦 | ✅ 保留——同上香囊 |
| 35 | 裆 | (无直接命中) | — |
| 35 | 服 | 变服易名 | ✅ 保留——易服行为 |
补充搜索发现: | 28 | 妆+服 | 靓妆盛服 | ✅ 保留——最直接的服饰描写 | | 35 | 襦 | 半糯(半襦) | ✅ 保留——OCR讹误,当为半襦 |
Step 4: 第2轮搜索——制度动作词
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 非烟传.txt
命中:0条
Step 5: 第3轮搜索——组合扩展词
补充搜索妆饰/色彩/蚕桑类:
rg -n '妆|饰|珰|钿|翠|珠|玉|金|银|绯|紫|青|白|黑|黄|红|绿|色|罗|纱|缣|绡' 非烟传.txt
新增命中: - 第6行:金凤笺 → 排除(笺纸) - 第9行:玉叶笺 → 排除(笺纸) - 第10行:彩笺 → 排除(笺纸) - 第18行:严妆 → 已收录 - 第28行:靓妆盛服 → 已收录
rg -n '蚕|桑|茧|缫|织|纺|匹|绢价|折帛|和买' 非烟传.txt
命中:0条
Step 6: 整理分类
有效服饰条目10条,分为5类:
| 类别 | 条目数 | 内容 |
|---|---|---|
| 体服 | 3 | 绔罗、盛服、半襦 |
| 佩饰 | 1 | 连蝉锦香囊 |
| 妆饰 | 4 | 严妆、靓妆、绿蛾、垂髫 |
| 社会服饰用语 | 2 | 衣缨之族、弱冠 |
| 变服行为 | 1 | 变服易名 |
Step 7: 产出三份文件
- ✅ 非烟传_原文提取.md(约7KB)
- ✅ 非烟传_总结.md(约6KB)
- ✅ 非烟传_日志.md(本文件)
关键发现
- 《非烟传》服饰内容极度稀少:37行文本中仅10条有效服饰信息,无任何制度性记载
- 服饰完全服务于爱情叙事:所有服饰描写均嵌于情节推进中
- "连蝉锦香囊"是唯一反复出现的服饰道具:文中3次提及,是叙事核心道具
- OCR讹误"半糯"当为"半襦":糯与襦形近,需校勘注意
- "变服易名"揭示唐代服饰与身份的绑定关系
- "若不胜绔罗"反映晚唐纤瘦审美:与盛唐以胖为美形成对照
踩坑记录
- "丝竹"非丝织品——首轮搜索需严格排除乐器义
- "幽襟""尘襟""芳履"均为比喻用法——襟/履在诗词中常作比喻,需据语境排除
- "乌丝简"非丝织品——指墨书竹简/纸笺
- "绣栊"非服饰刺绣——绣指窗格装饰
- "半糯"系OCR讹误——需据文理推断为"半襦"
- "金凤笺""玉叶笺""岩苔笺"等均为笺纸——虽含"金""玉"等字,但属书写材料非服饰
审核结果
对抗式审查
Q1:是否有遗漏的服饰内容? 检查全文37行,逐行审读。扩展搜索后发现"绿蛾"(第21行,眉妆)和"垂髫"(第24行,儿童发式)两条补充收录。文中大量使用笺纸(薛涛笺、金凤笺、玉叶笺、岩苔笺、彩笺),均属书写材料而非服饰,已正确排除。
Q2:排除是否过度? 复查排除的10条: - 丝竹(乐器)→ 确认排除 ✅ - 幽襟/尘襟(比喻)→ 确认排除 ✅ - 芳履(比喻)→ 确认排除 ✅ - 乌丝简(书写材料)→ 确认排除 ✅ - 绣栊(窗格装饰)→ 确认排除 ✅ - 华缄(书信)→ 确认排除 ✅ - 面色(表情)→ 确认排除 ✅ - 笺纸×5 → 确认排除 ✅
Q3:"弱冠"是否应排除? "弱冠"源自冠礼制度,但文中仅作年龄称谓。归入"社会服饰用语"类而非"首服"类,属合理降级处理。
Q4:"半糯"是否确为"半襦"? "半糯"在上下文"象觉跳去,业搏之,得其半糯"中,意为武公业抓住赵象留下的衣物。糯(nuò,糯米)在此毫无语义,襦(rú,短衣)则完全合理。且糯与襦字形相近,为典型OCR讹误。判定为半襦。
Q5:扩展搜索"绿蛾""垂髫"是否合理? - "绿蛾"指黛画蛾眉,属妆饰范畴,虽非词库核心词但为第3轮妆饰扩展搜索发现,合理收录。 - "垂髫"指儿童发式,属首服/发型范畴,文中仅作年龄称谓,与"弱冠"同类,合理收录但降级为妆饰/发型遗存。
全部通过 ✅