《宛如约》服饰内容提取 · 对话记录
时间:2026-04-20 任务:提取《宛如约》TXT文件中服饰相关内容,整理分类总结
操作流程
Step 0: 检查输入文件
wc -l /home/z/my-project/upload/part2/宛如约.txt
→ 532行,非大文件,可直接操作
Step 1: 读取参考模板
读取三个参考文件: - 总结.md(《吕氏春秋》服饰汇编,分类总结+引用+注释格式) - 日志.md(《晋会要》提取对话记录,流程记录格式) - 原文提取.md(《天工开物》原文提取,逐条引文格式)
Step 2: 5轮grep检索
第1轮:基础服饰词
grep -n '衣|裳|裘|冠|冕|弁|帽|巾|袍|裙|袂|褐|衫|褂|襦|袴|裤|帔|履|靴|舄|鞋|袜'
→ 命中行:19, 23, 39, 141, 157, 168, 183, 293, 394, 506
关键发现: - 行19:赵如子女扮男装(男衣+儒巾+靴儿)★核心 - 行39:小红凤翘+黄衫+绣花比甲 ★核心 - 行168:赵如子白纱衫+玄色水杉+荷花裙+碧玉簪 ★★全书最详 - 行157:司空约换旧衣密访 - 行293:张公子换华丽衣服
第2轮:丝织品类
grep -n '锦|绮|帛|绢|绫|罗|缎|绸|纱|缂丝|缯|纨|素|丝|绸'
→ 命中行:10,21,22,23,35,38,55,59,65,87,105,108,124,132,141,148,151,152,163,168,198,217,222,238,258,263,269,276,290,307,318,329,363,373,395,396,406,415,416,418,420,423,437,441,451,462,465,486,487,495,498,504,505,506,511,518,519,520,523
大量命中,但多数为"情丝""丝线"等非服饰用法。筛选有效: - 行141:纱衣 - 行151:绮罗/韦布/锦绣对比 ★核心 - 行152:尺头(整匹绸缎)★ - 行168:白纱衫子 ★★ - 行217:红绫 ★ - 行420:金花彩缎 ★ - 行451:锦绣珠玉 ★ - 行465:雕绣香车 ★ - 行520:锦彩百端 ★
无效命中(排除): - "情丝""丝丝""丝悬""红丝"——均为比喻用法 - "锦笺""锦绣一般"——前者指信笺,后者形容文章 - "箕裘"——比喻家族传承,非服饰
第3轮:等级服制词
grep -n '舆服|服色|冠服|章服|法服|朝服|祭服|常服|公服|吉服|丧服|品色|赐紫|赐绯|借紫|借绯'
→ 无命中
此轮零命中,说明《宛如约》为世情小说,无官服制度描写。
第4轮:配饰词
grep -n '笏|鱼袋|革带|玉带|金带|银带|幞头|凤冠|步摇|簪|钗|钏|镯|佩|玉佩|霞帔|帔帛|披帛'
→ 命中行:168, 329, 458, 498, 518
有效: - 行168:碧玉簪儿+金柁 ★★ - 行498:银簪(验毒)+簪花 ★ - 行518:簪花插翠 ★ - 行329:簪花之体(书法比喻,排除) - 行458:鸣珂佩玉(比喻,排除)
第5轮:纺织词
grep -n '绵|布|葛|麻|苎|棉|染|织|绣|纹|黼|黻'
→ 命中行:39,59,106,124,132,151,152,290,318,395,506
有效: - 行39:绣花比甲 ★ - 行151:韦布 ★ - 行506:晏黻(人名,排除)
无效命中(排除): - "棉笺"→应为锦笺之误,指信笺 - "布见""布摆"→非服饰用词 - "织女"等→比喻
Step 3: sed提取关键行
提取行:19, 39, 141, 151, 152, 157, 168, 217, 420, 451, 465, 498, 518, 520
Step 4: 筛选有效片段
最终保留有效服饰片段10处:
| 编号 | 行号 | 内容摘要 | 类型 |
|---|---|---|---|
| 1 | 19 | 男衣+儒巾+靴儿 | 女扮男装 |
| 2 | 39 | 凤翘+黄衫+绣花比甲 | 侍女服饰 |
| 3 | 141 | 纱衣 | 男子夏装 |
| 4 | 151 | 绮罗/韦布/锦绣 | 服饰审美 |
| 5 | 152 | 尺头(绸缎聘礼) | 婚嫁礼俗 |
| 6 | 157 | 旧衣(便服密访) | 男子便装 |
| 7 | 168 | 白纱衫+玄色水杉+荷花裙+碧玉簪 | 女性正装★ |
| 8 | 217 | 红绫题诗 | 科举婚庆 |
| 9 | 420/520 | 金莲宝烛/金花彩缎/锦彩百端 | 御赐婚礼 |
| 10 | 498/518 | 画眉搽粉/铅粉/簪花插翠/银簪 | 闺阁梳妆 |
排除的无效命中: - "情丝""红丝""丝丝"→比喻用法 - "锦笺"→信笺,非衣料 - "箕裘"→家族传承比喻 - "簪花之体"→书法风格 - "鸣珂佩玉"→身份比喻 - "布摆""布见"→动词 - "晏黻"→人名
Step 5: 分类整理
按7大类整理: 1. 女扮男装(1条) 2. 侍女服饰(1条) 3. 男子常服(3条) 4. 女性正式装束(2条,含核心段落) 5. 婚嫁服饰与礼俗(6条) 6. 闺阁梳妆(3条) 7. 诗中服饰意象(2条)
Step 6: 对抗式审查
审查项1:是否有遗漏?
- 全书532行,5轮grep覆盖所有服饰关键词
- 第3轮(等级服制)零命中,符合世情小说特征
- 诗意比喻("红丝"等)已排除,不属于服饰内容
审查项2:是否有误收?
- "箕裘"已排除(行394/395,比喻家族传承)
- "锦笺"已排除(信笺)
- "簪花之体"已排除(书法)
- "棉笺"可能为OCR误字(应为锦笺),已排除
审查项3:行号是否准确?
- 所有关键行号已通过sed -n逐行验证
- 行168为核心段落,原文与提取一致
审查项4:是否符合世情小说特征?
- 《宛如约》为明末清初才子佳人小说,服饰描写少而精
- 无官服制度描写(第3轮零命中)符合预期
- 服饰集中于女性角色描写和婚嫁场景,符合该类型小说特征
Step 7: 写入3个MD文件
- 宛如约_总结.md:分类总结+分析
- 宛如约_日志.md:本文件
- 宛如约_原文提取.md:逐条引文
关键发现
- 全书最详细的服饰描写仅1处(行168),赵如子问安装束,层次分明(内衫+外衫+裙+头饰)
- "素雅为美"是核心审美观——赵如子不施脂粉、不饰珠翠,韦布胜锦绣
- 女扮男装三件套(男衣+儒巾+靴儿)为明代小说标准配置
- 婚嫁以绸缎为核心——尺头、红绫、彩缎、锦彩,衣料是聘礼和御赐的主角
- 银簪验毒为古代闺阁生活常识的文学反映
- 无官服制度描写——第3轮grep零命中,符合才子佳人小说类型特征
关键踩坑记录
- "棉笺"疑为"锦笺"之OCR误字,原文指信笺非衣料
- "箕裘"出现2次(行394/395),均为"箕裘无继"(家族传承),与服饰无关
- 第2轮grep命中极多(50+行),但大量"情丝""红丝"为比喻用法,需逐条人工筛选
- "锦绣"一词在行318出现为"文章也做得锦绣一般",形容文章非服饰
审核结果
全部通过 ✅ — 原文均从TXT文件grep提取,有明确行号对应,无效命中已逐一排除。