《非烟传》服饰内容提取 · 操作日志

时间:2026-04-19 任务:提取《非烟传》全部服饰相关内容,整理分类总结 输入:/home/z/my-project/upload/part4/非烟传.txt 输出目录:/home/z/my-project/upload/4笔记output/非烟传/


操作流程

Step 0: 读取参考文件

读取 fushi-keywords.md → 服饰词库(核心词/制度动作词/组合扩展词/排除规则) 读取 参考/总结.md → 《吕氏春秋》总结模板 读取 参考/日志.md → 《晋会要》日志模板 读取 参考/原文提取.md → 《天工开物》原文提取模板

Step 1: 检查输入文件

wc -c 非烟传.txt → 6,226 字节 wc -l 非烟传.txt → 37 行

注:文件极小(<10KB,<100行),但遵守"严禁整本载入大TXT"规则,仍以grep先行定位。

Step 2: 创建输出目录

mkdir -p /home/z/my-project/upload/4笔记output/非烟传/

Step 3: 第1轮搜索——核心服饰词

rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 非烟传.txt

命中行:3, 12, 17, 18, 20, 21, 35(共7行,21次命中关键词)

逐条审查:

行号 关键词 原文片段 判定
3 若不胜绔罗 ✅ 保留——丝织品
3 其韵与丝竹合 ❌ 排除——丝竹=乐器
3 衣缨之族 ✅ 保留——衣冠代称
3 衣缨之族 ✅ 保留——冠缨代称
3 弱冠矣 ⚠️ 降级——仅年龄称谓
3 (无,在后续行)
12 洒幽襟 ❌ 排除——比喻内心
17 连蝉锦香囊 ✅ 保留——锦缎佩饰
18 严妆 ✅ 保留——妆饰
18 倚绣栊 ❌ 排除——绣花窗格
18 蝉锦 ✅ 保留——同上香囊
20 锦囊 ✅ 保留——同上香囊
20 乌丝简 ❌ 排除——墨书简札
20 尘襟 ❌ 排除——比喻世俗心念
20 芳履违和 ❌ 排除——比喻步履
21 蝉锦 ✅ 保留——同上香囊
35 (无直接命中)
35 变服易名 ✅ 保留——易服行为

补充搜索发现: | 28 | 妆+服 | 靓妆盛服 | ✅ 保留——最直接的服饰描写 | | 35 | 襦 | 半糯(半襦) | ✅ 保留——OCR讹误,当为半襦 |

Step 4: 第2轮搜索——制度动作词

rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 非烟传.txt

命中:0条

Step 5: 第3轮搜索——组合扩展词

补充搜索妆饰/色彩/蚕桑类:

rg -n '妆|饰|珰|钿|翠|珠|玉|金|银|绯|紫|青|白|黑|黄|红|绿|色|罗|纱|缣|绡' 非烟传.txt

新增命中: - 第6行:金凤笺 → 排除(笺纸) - 第9行:玉叶笺 → 排除(笺纸) - 第10行:彩笺 → 排除(笺纸) - 第18行:严妆 → 已收录 - 第28行:靓妆盛服 → 已收录

rg -n '蚕|桑|茧|缫|织|纺|匹|绢价|折帛|和买' 非烟传.txt

命中:0条

Step 6: 整理分类

有效服饰条目10条,分为5类:

类别 条目数 内容
体服 3 绔罗、盛服、半襦
佩饰 1 连蝉锦香囊
妆饰 4 严妆、靓妆、绿蛾、垂髫
社会服饰用语 2 衣缨之族、弱冠
变服行为 1 变服易名

Step 7: 产出三份文件


关键发现

  1. 《非烟传》服饰内容极度稀少:37行文本中仅10条有效服饰信息,无任何制度性记载
  2. 服饰完全服务于爱情叙事:所有服饰描写均嵌于情节推进中
  3. "连蝉锦香囊"是唯一反复出现的服饰道具:文中3次提及,是叙事核心道具
  4. OCR讹误"半糯"当为"半襦":糯与襦形近,需校勘注意
  5. "变服易名"揭示唐代服饰与身份的绑定关系
  6. "若不胜绔罗"反映晚唐纤瘦审美:与盛唐以胖为美形成对照

踩坑记录


审核结果

对抗式审查

Q1:是否有遗漏的服饰内容? 检查全文37行,逐行审读。扩展搜索后发现"绿蛾"(第21行,眉妆)和"垂髫"(第24行,儿童发式)两条补充收录。文中大量使用笺纸(薛涛笺、金凤笺、玉叶笺、岩苔笺、彩笺),均属书写材料而非服饰,已正确排除。

Q2:排除是否过度? 复查排除的10条: - 丝竹(乐器)→ 确认排除 ✅ - 幽襟/尘襟(比喻)→ 确认排除 ✅ - 芳履(比喻)→ 确认排除 ✅ - 乌丝简(书写材料)→ 确认排除 ✅ - 绣栊(窗格装饰)→ 确认排除 ✅ - 华缄(书信)→ 确认排除 ✅ - 面色(表情)→ 确认排除 ✅ - 笺纸×5 → 确认排除 ✅

Q3:"弱冠"是否应排除? "弱冠"源自冠礼制度,但文中仅作年龄称谓。归入"社会服饰用语"类而非"首服"类,属合理降级处理。

Q4:"半糯"是否确为"半襦"? "半糯"在上下文"象觉跳去,业搏之,得其半糯"中,意为武公业抓住赵象留下的衣物。糯(nuò,糯米)在此毫无语义,襦(rú,短衣)则完全合理。且糯与襦字形相近,为典型OCR讹误。判定为半襦。

Q5:扩展搜索"绿蛾""垂髫"是否合理? - "绿蛾"指黛画蛾眉,属妆饰范畴,虽非词库核心词但为第3轮妆饰扩展搜索发现,合理收录。 - "垂髫"指儿童发式,属首服/发型范畴,文中仅作年龄称谓,与"弱冠"同类,合理收录但降级为妆饰/发型遗存。

全部通过 ✅