《婆罗岸全传》服饰内容提取 · 操作日志
时间:2026-04-20 任务:提取《婆罗岸全传》全部服饰相关内容,整理分类总结 文件:/home/z/my-project/upload/part2/婆罗岸全传.txt(692行,279KB)
操作流程
Step 1: 读取参考模板
读取3个参考文件,理解格式结构: - 总结.md → 分类综述 + 引文 + 按语 + 总结表格 - 日志.md → 操作步骤 + 关键发现 + 踩坑记录 + 审核结果 - 原文提取.md → 带行号的原文片段 + 词语注释
Step 2: 第1轮grep——基础服饰词
rg -n "衣|裳|裘|冠|冕|弁|帽|巾|袍|裙|袂|褐|衫|褂|襦|袴|裤|帔|履|靴|舄|鞋|袜" 婆罗岸全传.txt
匹配58行,逐行审读后筛选有效服饰条目约25条,假阳性约33条。
假阳性排除: - "衣"作为"衣服"泛称出现极多,但大量仅作"穿衣/脱衣/换衣"动作,无服饰描写价值(如"解衣上床""穿好衣裳""换了衣服"等) - "履"仅出现在回目"履佛地魂消因果事"中,非服饰义 - "褐"无匹配 - "裘、冕、弁、袍、帔、靴、舄"无匹配——本书非官场题材,无冕服体系
Step 3: 第2轮grep——丝织品词
rg -n "锦|绮|帛|绢|绫|罗|缎|绸|纱|缂丝|缯|纨|素|丝|绸" 婆罗岸全传.txt
匹配31行,筛选有效8条。
假阳性排除: - "素"大量出现为"素昔""素来"等副词,非"素丝/素帛"义 - "丝"出现为"一丝儿气力""蚕丝"等,多数非服饰相关 - "锦绣江山"为成语,非服饰 - "软棉一般"为比喻,非棉织品 - "绮"无匹配
有效提取: - L41: 锦衣绣服、锦绣江山(前者有效) - L47: 玉色绡金帐 - L49: 红绫被 - L62: 松花绸被 - L68: 绫罗绸绢(寿衣十七件) - L171: 花绸儿裹住了 - L254: 红绫被 - L479: 紫绸袜脚儿
Step 4: 第3轮grep——等级服色词
rg -n "舆服|服色|冠服|章服|法服|朝服|祭服|常服|公服|吉服|丧服|品色|赐紫|赐绯|借紫|借绯" 婆罗岸全传.txt
匹配0行。本书为白话小说,无官制服饰记载。
Step 5: 第4轮grep——配饰词
rg -n "笏|鱼袋|革带|玉带|金带|银带|幞头|凤冠|步摇|簪|钗|钏|镯|佩|玉佩|霞帔|帔帛|披帛" 婆罗岸全传.txt
匹配7行,筛选有效5条。
有效提取: - L231: 金簪子、珠环儿、金镯子、珠花儿(首饰清单,含估价) - L254: 金玉镯子 - L436: 首饰簪环(聘礼) - L454: 簪髻 - L545: 钗钿
假阳性:无,7条中5条有效,2条为同段重复。
Step 6: 第5轮grep——纺织材料词
rg -n "绵|布|葛|麻|苎|棉|染|织|绣|纹|黼|黻" 婆罗岸全传.txt
匹配34行,筛选有效6条。
假阳性排除: - "绣房"(L18)为"绣阁"义,指女子闺房,非刺绣工艺 - "纹"多指蛇纹、花纹,L114"蛇字纹"为狗额上天然花纹 - "绵"出现2次均为"软棉一般"的比喻用法 - "麻"无服饰义匹配 - "棉"无棉布义匹配 - "染"出现为"染患""沾染",非染色工艺 - "织"无匹配 - "黼、黻"无匹配
有效提取: - L41: 绣服(刺绣服装) - L47: 绣鞋(刺绣鞋) - L43: 布旗 - L171: 花绸儿(花绸) - L479: 绣鞋、褶袴 - L568: 布匹、衣衾
Step 7: sed提取上下文
对筛选出的有效行号,用sed -n '行号±2p'提取上下文,确认语境。共提取约25段原文片段。
Step 8: 分类整理
将有效服饰内容分为10大类: 1. 妖精幻形服饰 2. 闺阁贵族服饰 3. 丧葬服饰 4. 日常男女服饰 5. 青楼妓家服饰 6. 粉头接客服饰详写 7. 首饰配件 8. 纺织材料与丧葬用布 9. 布旗 10. 衣裳与身份
Step 9: 对抗式学术审查
见下文。
关键发现
- 本书服饰描写集中于女性:全书几乎无男性服饰正面描写,唯一的男性服饰细节是"锦衣绣服"(蛇妖幻形)和"马褂"(魏公子),以及"暖肚儿"(男性贴身物)
- 青楼服饰描写最详:英姐接客时的珠冠、兜肚、绣鞋、褶袴等,是全书最完整的女性服饰组合描写
- 寿衣规格可考:"十七件,俱是绫罗绸绢",贵族丧葬用四等丝料,数量可观
- 首饰有市价:金簪5两、珠环10两、金镯16两、珠花12两,为清代民间首饰价值的参考
- 缠足文化反映:"金莲不满三寸"、绣鞋、袜脚儿,详细反映了清代妓家缠足习俗
- 无官制服饰:第3轮grep零匹配,全书不涉及舆服制度、品色等级
- 丝织品种丰富但无工艺描述:绫、罗、绸、绢、纱、缎、绡均有提及,但均为成品使用,无纺织染色工艺记载
关键踩坑记录
- "素"字假阳性极高:31条匹配中"素"占约10条,几乎全部为副词用法
- "衣"字泛化严重:58条匹配中约一半为"穿衣/脱衣"动作描写,无服饰细节
- "绣"字需区分:"绣房"≠刺绣,"绣鞋"才是服饰
- "纹"字非服饰:狗额"蛇字纹"为天然花纹
- "绵/棉"无棉织品义:全书仅"软棉一般"比喻和"布匹"(丧葬用布)
- OCR讹字:"¥子"应为"袴子","八枉"疑为"八柱"或"八宝"
- 本书体裁限制:白话艳情小说,服饰描写服务于人物塑造和场景氛围,无制度性记载
审核结果
全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应。假阳性已逐一排除,有效片段均经上下文语境验证。