《八美图》服饰内容提取 · 操作日志
时间:2026-04-19 任务:对《八美图》全文进行服饰内容提取,输出3份MD文件 输入:/home/z/my-project/upload/part1/八美图.txt(2031行) 输出:/home/z/my-project/upload/1小说output/八美图/
操作流程
Step 0: 读取参考文件
读取 /home/z/my-project/upload/参考/总结.md → 吕氏春秋服饰总结格式
读取 /home/z/my-project/upload/参考/日志.md → 晋会要操作日志格式
读取 /home/z/my-project/upload/参考/原文提取.md → 天工开物原文提取格式
参考格式确认:总结按分类表格+核心发现,原文提取按轮次逐条列出原文行号,日志记录操作流程与统计。
Step 1: 读取输入文件
wc -l 八美图.txt → 2031行
文件编码:UTF-8,清代章回小说,32回
Step 2: 8轮关键词grep检索
| 轮次 | 关键词 | 命中行数 | 主要内容 |
|---|---|---|---|
| 1 | 衣|裳|裘|袍|褐|襦|裙|袴|衫|袂|衽 | ~70行 | 更换衣巾、衫裙、罗裙、宽衣解带、布裙、衣裳单薄 |
| 2 | 冠|冕|弁|巾|帻|幞头|帽|笠|盔 | ~30行 | 方巾、武巾、紫金冠、黄金八宝盔、衣冠、冠诰 |
| 3 | 佩|笏|带|鱼袋|玉佩|蹀躞 | ~60行 | 八进宝丝绦、腰带、宽衣解带、乌带、金瓜铜槌 |
| 4 | 丝|帛|绢|锦|绮|绫|罗|缎|绸|纱|葛|麻|布|毡 | ~40行 | 绫罗绸缎、大红绫鞋、罗帕、彩缎、绸缎、毡毯 |
| 5 | 衮|朝服|公服|常服|祭服|赐服|赐紫|赐绯|品色|舆服|服色|冠服 | 0行 | 无匹配 |
| 6 | 舄|履|屦|靴|鞋|甲|铠|胄|兜鍪 | ~25行 | 皂靴、绣花鞋、高底靴子、锁子黄金甲、战靴、号衣 |
| 7 | 紫|绯|绿袍|青袍|白袍|红袍|金带|玉带|银带 | 1行 | 仅"紫金冠" |
| 8 | 黼黻|章服|蟒袍|补服|龙袍|凤冠|霞帔|云肩|钿|簪|钗|步摇 | ~12行 | 荆钗、凤冠霞帔、钗环、凤钗、裙钗、犀钗 |
Step 3: 去重整理
8轮检索原始命中约238行,去除重复行后,实际涉及服饰描写的有效原文行约85行。
Step 4: 分类归纳
按服饰功能分为8大类: 1. 文士装束(方巾海青丝绦皂靴) 2. 女子日常装束(衫裙罗裙绣花鞋钗环) 3. 男扮女装(妇人衣裳高底鞋罗裙钗环脚带) 4. 女扮男装(箭杆衣武巾乌带皂靴) 5. 军旅铠甲(锁子黄金甲黄金八宝盔战靴号衣) 6. 婚嫁封赠(凤冠霞帔冠诰彩缎) 7. 纺织品面料(绫罗绸缎大红绫罗帕彩缎毡毯) 8. 首饰(荆钗凤钗钗环犀钗钗梳匣)
Step 5: 生成输出文件
- 八美图_原文提取.md(16,381字节)✓ ≤20KB
- 八美图_总结.md(约6,500字节)✓ ≤20KB
- 八美图_日志.md(本文件)✓ ≤20KB
关键发现
-
男扮女装情节最为突出:柳树春扮张金定冲喜是全书服饰描写最集中的段落,详细记录了从"卸下衣巾脱了靴子"到"穿好大红绫绣花高底鞋子收好脚带把罗裙放落"的完整换装过程。
-
女扮男装清单式描写:七套箭杆衣、七顶武巾、七条乌带、七双皂靴——七套并列,是章回小说特有的铺陈手法。
-
第5轮(朝服制度)零命中:本书为通俗小说,完全不涉及衮服、朝服、品色等制度术语,与史书/政书类文献形成鲜明对比。
-
"裙钗"高频出现:作为女性代称反复出现,"裙"(下裳)与"钗"(首饰)构成女子身份最核心的两个服饰符号。
-
凤冠霞帔为叙事闭环:第六回许诺"凤冠霞帔做的夫人",第三十回圣旨"各赠冠诰一重",形成全书服饰叙事的完整闭环。
-
靴子是性别越界的关键道具:男足大女足小,靴子内衬棉花/白棉是跨越性别差异的核心技巧,"惟金莲可辨"点明足部是性别辨认的关键。
踩坑记录
- "怒发冲冠"(行829)中"冠"为成语用法,非服饰描写,已在分类中标注。
- "纨绔"(行53)中"绔"虽属服饰词,但此为成语"纨绔行藏",非具体服饰描写。
- "裙钗"作为女性代称,多次出现但语境相同,归纳处理。
- "丝萝""绸缪"等为婚姻情感比喻词,非实际纺织品描写,已在原文提取中注明。
- 第5轮零命中:本书体裁决定其不含正式服制术语,此结果符合预期。