《俗话倾谈》服饰内容提取·操作日志

时间:2026-04-20 任务:提取《俗话倾谈》全部服饰相关内容,整理分类总结


操作流程

Step 1: 文件基本信息

wc -l /home/z/my-project/upload/part1/俗话倾谈.txt
→ 740行(271KB,粤语方言劝善小说,清·邵彬儒著)

Step 2: 参考模板读取

读取3份参考模板: - /home/z/my-project/upload/参考/总结.md → 《吕氏春秋》格式 - /home/z/my-project/upload/参考/日志.md → 《晋会要》格式 - /home/z/my-project/upload/参考/原文提取.md → 《天工开物》格式

另参考同类型小说输出: - /home/z/my-project/upload/1小说output/何典/何典_总结.md - /home/z/my-project/upload/1小说output/何典/何典_原文提取.md - /home/z/my-project/upload/1小说output/何典/何典_日志.md

Step 3: 8轮grep -n 服饰关键词提取

轮次 关键词 命中行数(去重前) 关键发现
R1 衣/裳/袍/衫/袄/褂 ~25行 "洗水蓝衫""花衫袖""蓝布长衫""长皮袍""袍褂""烂衫烂裤""汗衫""白麻衫"
R2 冠/帽/巾/帻/幞/冕 ~5行 "缨帽""金线帽""白草帽"
R3 裙/裤/屦/履/鞋/靴/袜 ~10行 "大红裙""白布裤""蝴蝶头鞋""深布白袜""靴"
R4 带/佩/绶/环/簪/钗/笏 ~8行 "包头带""绉纱包头带""金钗""裙钗""环佩"
R5 丝/帛/绢/绸/缎/锦/纱/罗/麻/布/葛/裘/皮 ~20行 "绔纱蚊帐""绸缎铺""绉纱""粗衣麻布""绫罗绸缎""蓑衣""皮草""兽皮"
R6 青/赤/朱/黄/白/黑/玄/紫/绿/绣/纹 ~25行 "洗水蓝""大红裙""白麻衫""白布裤",大量非服饰色彩需筛除
R7 衮/冕/弁/朝服/祭服/丧服/蟒/龙袍/披/袂/裾/襟/袖/领/裆/褐/襕 ~8行 "衫襟""衫袖""披麻""孝服""披枷带锁""袈裟"
R8 装/妆/打扮/穿戴/缠/裹/凤冠/霞帔/纱帽/朝衣/布衣/衣冠/衣裳 ~15行 "打扮我光辉""置衣裳""衣衫褴楼""华丽衣裳""衣裳首饰"

补充检索:包头/缨帽/金钗/花衫/皮袍/绸缎/绉纱/朝珠/袍褂/孝服/白麻/汗衫/深布白袜/蝴蝶头鞋/金线帽 + 髻/钗/首饰/胭脂/脂粉/梳光头/搽粉/戴好花/插花/珠圈/银钮

8轮合计去重前命中:约116条 → 去重后独立行号31处 → 有效服饰条目42条

Step 4: sed验证关键行

对31个关键行号逐一审读,确认服饰相关内容,剔除纯色彩/纯语境匹配(如"黄瘦如柴""面青青""青筋"等非服饰色彩,"牛皮鼓""皮开肉裂"等非服饰用皮)。

Step 5: 分类整理

按11大类整理: 1. 珊瑚服饰描写(6条) 2. 臧姑服饰与妆扮(2条) 3. 大成服饰(1条) 4. 二成夫妻购物与服饰(7条) 5. 凌氏与克德论妇饰(1条) 6. 慎氏置衣打首饰(2条) 7. 官服与官场服饰(2条) 8. 阴间服饰(5条) 9. 丧葬服饰(4条) 10. 砒霜钵与盲家婆服饰对比(6条) 11. 其他服饰相关(6条)

Step 6: 保存三份文件


关键发现

  1. 全书最完整男性服饰组合:大成——金线帽+蝴蝶头鞋+深布白袜+蓝布长衫(第88行),为读书人下地干活的装束,从帽到鞋一应俱全
  2. 全书最详尽的购物清单:臧姑购物——金钦玉钢+珠圈银钮+大红裙+花衫袖+长皮袍+大红绒被(第99行),暴发户心态的集中体现
  3. 全书最鲜明的服饰对比:砒霜钵着绫罗绸缎 vs 盲家婆穿粗衣麻布(第693行),贫富与善恶的服饰化表达
  4. 全书最戏剧化的服饰道具:绉纱包头带——从日常头饰变为勒死家婆的凶器(第695行)
  5. 全书唯一官服描写:县官顶戴+朝靴+朝珠+袍褂(第493行),且出现在阴间被剥脱的场景
  6. 丧服的强制性:白麻衫、披麻、孝服均出现在被强制要求穿戴的语境
  7. "补破遮寒"是全书服饰伦理核心命题:盲家婆的质问——穿衣究竟为了保暖还是虚荣
  8. 粤语方言服饰词汇丰富:洗水蓝衫、花衫袖、钮耳崩、包头带、白麻衫等均为方言用法
  9. 衣禄为命运概念:"衣禄丰盈""补回衣禄"将服饰与因果福报挂钩
  10. 首饰出现于负面语境:臧姑的金钦玉钢、慎氏的置衣裳打首饰均为挥霍

关键踩坑记录


审核清单

审核项 结果
所有grep结果是否逐一审读 ✅ 是
非服饰匹配是否已剔除 ✅ 是(牛皮鼓、皮开肉裂、面青青等已排除)
原文引用是否逐字核对 ✅ 是
分类是否穷尽无遗漏 ✅ 42条全覆盖
三份文件格式是否一致 ✅ 是
文件大小是否均≤20KB ✅ 是(原文提取~9KB,总结~7KB,日志~5KB)
是否使用批处理脚本 ✅ 否,全部逐条操作
是否整本载入LLM ✅ 否,先grep后审读