《廿载繁华梦》服饰内容提取 · 工作日志

时间:2026-03-05 任务:提取《廿载繁华梦》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

读取 /home/z/my-project/upload/参考/总结.md(吕氏春秋模板)
读取 /home/z/my-project/upload/参考/日志.md(晋会要模板)
读取 /home/z/my-project/upload/参考/原文提取.md(天工开物模板)

三模板风格各异:总结.md偏学术分类,日志.md偏操作记录,原文提取.md偏逐条引文。本任务综合三模板优点。

Step 2: 检查源文件

wc -l 廿载繁华梦.txt → 729行

文件729行,中等规模,可用grep+sed处理。

Step 3: 5轮grep -n

轮次 关键词 匹配行数 有效行数
1-基础 衣|裳|裘|冠|袍|裙|袂|褐|衫|褂|履|靴|鞋|袜 ~45行 ~30行
2-丝织 锦|绮|帛|绢|绫|罗|缎|绸|纱|缯|纨|素 ~30行 ~20行
3-等级 舆服|服色|冠服|朝服|常服|公服|吉服|丧服|品色|赐紫|赐绯 0行 0行
4-配饰 笏|鱼袋|革带|玉带|金带|银带|幞头|凤冠|步摇|簪|钗|钏|镯|佩|玉佩|霞帔 ~10行 ~8行
5-纺织 绵|布|葛|麻|苎|棉|染|织|绣|纹|黼|黻 ~25行 ~15行

关键发现:第3轮(等级类关键词)零匹配——本书为谴责小说,不用舆服、冠服等制度术语,而以"袍服""补褂""顶子"等俗语描述官服。

Step 4: sed提取关键段落

逐行提取以下核心段落(行号→内容): - L120:香屏盛装(最完整女性服饰描写) - L131:马秀兰装束 - L122:李子良医士装束 - L199-200:贺婚礼单+凤冠霞帔 - L262:志存和尚装束 - L308:马氏二品补褂 - L338:火灾损失衣料清单 - L344:容尼姑马布外衣 - L349-354:绣衣定制全流程 - L370:桂妹失衣 - L390:周庸佑回乡官服+马氏回乡盛装 - L476:淑姬嫁妆服饰+头面清单 - L496:紫檀牀锦帐绣枕 - L651:抄家脱首饰 - L701:春桂澳门卖弄+尼姑绣衣钻石

Step 5: 筛选与排除

排除以下伪匹配(服饰词出现但非服饰内容): - L53 "衣冠王谢" → 文学典故,保留于象征类 - L54 "佩玉带金鱼" → 序中典故,保留于象征类 - L67 "纨絝子弟" → 习语,保留于象征类 - L315 "锦上花" → 习语,排除 - L420 "鬓影衣香" → 习语,排除 - L55 "锦绣文章" → 习语,排除 - L162 "篇篇锦绣" → 习语,排除 - L229 "布政使" → 官职名,排除 - L59 "文采宫室" → 不涉及服饰,排除

Step 6: 分类

按9类整理: 1. 女性盛装描写(4条核心) 2. 婚嫁服饰与嫁妆(4条) 3. 官服品级(4条) 4. 尼姑法服(3条) 5. 男性服饰(3条) 6. 火灾损失服饰(1条) 7. 头面首饰(3条) 8. 室内纺织陈设(3条) 9. 服饰象征与对比(4条)

Step 7: 对抗式审查

自查问题清单

# 审查项 结果
1 有无遗漏重要服饰描写? ✅ 5轮grep覆盖5类关键词,核心段落均已提取
2 有无误收非服饰内容? ✅ "锦上花""鬓影衣香"等习语已排除
3 第3轮零匹配是否遗漏? ✅ 本书用"补褂""袍服""顶子"代替制度术语,已另归入官服类
4 原文引文是否准确? ✅ 均从sed提取,行号对应原文
5 分类是否合理? ✅ 9类覆盖盛装、婚嫁、官服、法服、男性、火灾、首饰、陈设、象征
6 MD文件是否超20KB? ✅ 原文提取约12KB,总结约8KB,日志约5KB
7 是否违反"严禁批处理/for循环"规则? ✅ 所有grep/sed均为单条命令
8 是否只处理一本? ✅ 仅处理廿载繁华梦.txt

关键发现

  1. "荷兰缎子"为全书标志性丝织品:香屏大褂、马氏大褂、容尼姑绣衣、淑姬嫁妆箭袖小袄,四度出现,为晚清洋货入粤的消费文化缩影
  2. 皮草等级暗合制度:金貂 > 银鼠 > 灰鼠,与清代服饰等级吻合
  3. 钻石为粤地富豪首饰之尊:非传统玉石,而是西洋钻石,从耳塞到衣钮到裙帮口无所不在
  4. 尼姑绣衣镶钻石为全书最荒诞细节——法服本应素朴,马氏却以荷兰缎子配钻石定制,折射富户与宗教的畸形关系
  5. 第3轮零匹配揭示本书语体特征——谴责小说不用制度术语,以俗语叙事

关键踩坑记录


审核结果

全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应。5轮关键词覆盖基础、丝织、等级、配饰、纺织五大类,筛除伪匹配后分类整理为9类。