《廿载繁华梦》服饰内容提取 · 工作日志
时间:2026-03-05 任务:提取《廿载繁华梦》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
读取 /home/z/my-project/upload/参考/总结.md(吕氏春秋模板)
读取 /home/z/my-project/upload/参考/日志.md(晋会要模板)
读取 /home/z/my-project/upload/参考/原文提取.md(天工开物模板)
三模板风格各异:总结.md偏学术分类,日志.md偏操作记录,原文提取.md偏逐条引文。本任务综合三模板优点。
Step 2: 检查源文件
wc -l 廿载繁华梦.txt → 729行
文件729行,中等规模,可用grep+sed处理。
Step 3: 5轮grep -n
| 轮次 | 关键词 | 匹配行数 | 有效行数 |
|---|---|---|---|
| 1-基础 | 衣|裳|裘|冠|袍|裙|袂|褐|衫|褂|履|靴|鞋|袜 | ~45行 | ~30行 |
| 2-丝织 | 锦|绮|帛|绢|绫|罗|缎|绸|纱|缯|纨|素 | ~30行 | ~20行 |
| 3-等级 | 舆服|服色|冠服|朝服|常服|公服|吉服|丧服|品色|赐紫|赐绯 | 0行 | 0行 |
| 4-配饰 | 笏|鱼袋|革带|玉带|金带|银带|幞头|凤冠|步摇|簪|钗|钏|镯|佩|玉佩|霞帔 | ~10行 | ~8行 |
| 5-纺织 | 绵|布|葛|麻|苎|棉|染|织|绣|纹|黼|黻 | ~25行 | ~15行 |
关键发现:第3轮(等级类关键词)零匹配——本书为谴责小说,不用舆服、冠服等制度术语,而以"袍服""补褂""顶子"等俗语描述官服。
Step 4: sed提取关键段落
逐行提取以下核心段落(行号→内容): - L120:香屏盛装(最完整女性服饰描写) - L131:马秀兰装束 - L122:李子良医士装束 - L199-200:贺婚礼单+凤冠霞帔 - L262:志存和尚装束 - L308:马氏二品补褂 - L338:火灾损失衣料清单 - L344:容尼姑马布外衣 - L349-354:绣衣定制全流程 - L370:桂妹失衣 - L390:周庸佑回乡官服+马氏回乡盛装 - L476:淑姬嫁妆服饰+头面清单 - L496:紫檀牀锦帐绣枕 - L651:抄家脱首饰 - L701:春桂澳门卖弄+尼姑绣衣钻石
Step 5: 筛选与排除
排除以下伪匹配(服饰词出现但非服饰内容): - L53 "衣冠王谢" → 文学典故,保留于象征类 - L54 "佩玉带金鱼" → 序中典故,保留于象征类 - L67 "纨絝子弟" → 习语,保留于象征类 - L315 "锦上花" → 习语,排除 - L420 "鬓影衣香" → 习语,排除 - L55 "锦绣文章" → 习语,排除 - L162 "篇篇锦绣" → 习语,排除 - L229 "布政使" → 官职名,排除 - L59 "文采宫室" → 不涉及服饰,排除
Step 6: 分类
按9类整理: 1. 女性盛装描写(4条核心) 2. 婚嫁服饰与嫁妆(4条) 3. 官服品级(4条) 4. 尼姑法服(3条) 5. 男性服饰(3条) 6. 火灾损失服饰(1条) 7. 头面首饰(3条) 8. 室内纺织陈设(3条) 9. 服饰象征与对比(4条)
Step 7: 对抗式审查
自查问题清单:
| # | 审查项 | 结果 |
|---|---|---|
| 1 | 有无遗漏重要服饰描写? | ✅ 5轮grep覆盖5类关键词,核心段落均已提取 |
| 2 | 有无误收非服饰内容? | ✅ "锦上花""鬓影衣香"等习语已排除 |
| 3 | 第3轮零匹配是否遗漏? | ✅ 本书用"补褂""袍服""顶子"代替制度术语,已另归入官服类 |
| 4 | 原文引文是否准确? | ✅ 均从sed提取,行号对应原文 |
| 5 | 分类是否合理? | ✅ 9类覆盖盛装、婚嫁、官服、法服、男性、火灾、首饰、陈设、象征 |
| 6 | MD文件是否超20KB? | ✅ 原文提取约12KB,总结约8KB,日志约5KB |
| 7 | 是否违反"严禁批处理/for循环"规则? | ✅ 所有grep/sed均为单条命令 |
| 8 | 是否只处理一本? | ✅ 仅处理廿载繁华梦.txt |
关键发现
- "荷兰缎子"为全书标志性丝织品:香屏大褂、马氏大褂、容尼姑绣衣、淑姬嫁妆箭袖小袄,四度出现,为晚清洋货入粤的消费文化缩影
- 皮草等级暗合制度:金貂 > 银鼠 > 灰鼠,与清代服饰等级吻合
- 钻石为粤地富豪首饰之尊:非传统玉石,而是西洋钻石,从耳塞到衣钮到裙帮口无所不在
- 尼姑绣衣镶钻石为全书最荒诞细节——法服本应素朴,马氏却以荷兰缎子配钻石定制,折射富户与宗教的畸形关系
- 第3轮零匹配揭示本书语体特征——谴责小说不用制度术语,以俗语叙事
关键踩坑记录
- "脱褐"(L195)本指脱去粗布衣,妓院用语指从良脱籍,易误认为服饰描写
- "补褂"(L308)即补服,属于等级服饰,但第3轮关键词未覆盖此俗语
- "局缎"(L476)为晚清织造局产缎子,非通用词汇,需加注
- "马布"(L344)即麻布,"马"通"麻",非马匹之意
审核结果
全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应。5轮关键词覆盖基础、丝织、等级、配饰、纺织五大类,筛除伪匹配后分类整理为9类。