《八美图》服饰内容提取 · 操作日志

时间:2026-04-19 任务:对《八美图》全文进行服饰内容提取,输出3份MD文件 输入:/home/z/my-project/upload/part1/八美图.txt(2031行) 输出:/home/z/my-project/upload/1小说output/八美图/


操作流程

Step 0: 读取参考文件

读取 /home/z/my-project/upload/参考/总结.md → 吕氏春秋服饰总结格式
读取 /home/z/my-project/upload/参考/日志.md → 晋会要操作日志格式
读取 /home/z/my-project/upload/参考/原文提取.md → 天工开物原文提取格式

参考格式确认:总结按分类表格+核心发现,原文提取按轮次逐条列出原文行号,日志记录操作流程与统计。

Step 1: 读取输入文件

wc -l 八美图.txt → 2031行
文件编码:UTF-8,清代章回小说,32回

Step 2: 8轮关键词grep检索

轮次 关键词 命中行数 主要内容
1 衣|裳|裘|袍|褐|襦|裙|袴|衫|袂|衽 ~70行 更换衣巾、衫裙、罗裙、宽衣解带、布裙、衣裳单薄
2 冠|冕|弁|巾|帻|幞头|帽|笠|盔 ~30行 方巾、武巾、紫金冠、黄金八宝盔、衣冠、冠诰
3 佩|笏|带|鱼袋|玉佩|蹀躞 ~60行 八进宝丝绦、腰带、宽衣解带、乌带、金瓜铜槌
4 丝|帛|绢|锦|绮|绫|罗|缎|绸|纱|葛|麻|布|毡 ~40行 绫罗绸缎、大红绫鞋、罗帕、彩缎、绸缎、毡毯
5 衮|朝服|公服|常服|祭服|赐服|赐紫|赐绯|品色|舆服|服色|冠服 0行 无匹配
6 舄|履|屦|靴|鞋|甲|铠|胄|兜鍪 ~25行 皂靴、绣花鞋、高底靴子、锁子黄金甲、战靴、号衣
7 紫|绯|绿袍|青袍|白袍|红袍|金带|玉带|银带 1行 仅"紫金冠"
8 黼黻|章服|蟒袍|补服|龙袍|凤冠|霞帔|云肩|钿|簪|钗|步摇 ~12行 荆钗、凤冠霞帔、钗环、凤钗、裙钗、犀钗

Step 3: 去重整理

8轮检索原始命中约238行,去除重复行后,实际涉及服饰描写的有效原文行约85行。

Step 4: 分类归纳

按服饰功能分为8大类: 1. 文士装束(方巾海青丝绦皂靴) 2. 女子日常装束(衫裙罗裙绣花鞋钗环) 3. 男扮女装(妇人衣裳高底鞋罗裙钗环脚带) 4. 女扮男装(箭杆衣武巾乌带皂靴) 5. 军旅铠甲(锁子黄金甲黄金八宝盔战靴号衣) 6. 婚嫁封赠(凤冠霞帔冠诰彩缎) 7. 纺织品面料(绫罗绸缎大红绫罗帕彩缎毡毯) 8. 首饰(荆钗凤钗钗环犀钗钗梳匣)

Step 5: 生成输出文件


关键发现

  1. 男扮女装情节最为突出:柳树春扮张金定冲喜是全书服饰描写最集中的段落,详细记录了从"卸下衣巾脱了靴子"到"穿好大红绫绣花高底鞋子收好脚带把罗裙放落"的完整换装过程。

  2. 女扮男装清单式描写:七套箭杆衣、七顶武巾、七条乌带、七双皂靴——七套并列,是章回小说特有的铺陈手法。

  3. 第5轮(朝服制度)零命中:本书为通俗小说,完全不涉及衮服、朝服、品色等制度术语,与史书/政书类文献形成鲜明对比。

  4. "裙钗"高频出现:作为女性代称反复出现,"裙"(下裳)与"钗"(首饰)构成女子身份最核心的两个服饰符号。

  5. 凤冠霞帔为叙事闭环:第六回许诺"凤冠霞帔做的夫人",第三十回圣旨"各赠冠诰一重",形成全书服饰叙事的完整闭环。

  6. 靴子是性别越界的关键道具:男足大女足小,靴子内衬棉花/白棉是跨越性别差异的核心技巧,"惟金莲可辨"点明足部是性别辨认的关键。


踩坑记录