《镜花缘》服饰整理日志
处理时间:2026-05-18 15:39 输入文件:/home/z/my-project/upload/part4/镜花缘.txt 输出目录:/home/z/my-project/upload/4小说output/镜花缘/ 文件大小:1,257,677字节,3,136行 全书回数:100回
处理流程
- 文件检查:确认输入文件为《镜花缘》全100回完整文本(1.2MB,3136行)。
- 关键词提取:使用ripgrep多轮搜索服饰关键词,涵盖服装、头饰、鞋履、饰品、妆容、缠足、面料等7大类约60个关键词组合。
- 初步匹配:首轮宽泛关键词匹配948行,含大量非服饰用字。
- 精确过滤:使用精确服饰词组二次匹配,去重排序后得到231条候选行。
- Python处理:以约60个核心关键词正则匹配逐行扫描标注回目,最终提取189条服饰相关原文。
- 分章归类:将提取结果按回目分组生成原文提取文件。
- 总结撰写:按7大分类归纳服饰描写分析文学功能。
提取统计
| 指标 | 数值 |
|---|---|
| 原文总行数 | 3,136 |
| 首轮宽泛匹配 | 948行 |
| 精确关键词匹配 | 231行 |
| 最终提取条目 | 189条 |
| 涉及回目 | 约35回 |
服饰描写分布
| 回目范围 | 主要服饰内容 | 条目数 |
|---|---|---|
| 第1-6回 | 仙界服饰(四灵大仙道袍、魁星装束)、武后宫廷 | ~8 |
| 第9-10回 | 君子国衣冠带剑、大人国红绫护足 | ~5 |
| 第10-11回 | 骆红蕖白布箭衣渔婆巾、青衫 | ~5 |
| 第12-14回 | 廉锦枫银红小袄皮裤、元股国斗笠鱼皮裤 | ~6 |
| 第16-17回 | 黑齿国红衣紫衫三寸金莲脂粉 | ~15 |
| 第21回 | 白民国白衣白帽绫罗金镯香珠 | ~5 |
| 第23-24回 | 淑士国儒巾青衫衣冠服制颜色等级 | ~8 |
| 第32-37回 | 女儿国男女换装缠足穿耳凤冠霞帔 | ~60 |
| 第38-39回 | 轩辕国王金冠黄袍蛇尾 | ~3 |
| 其他回目 | 零散服饰描写 | ~10 |
关键词清单
服装类
道袍、蟒袍、龙袍、红袍、绿袍、黄袍、黑袍、紫袍、白袍、青衫、红衫、紫衫、蓝衫、白衣、紫衣、红衣、绿衣、箭衣、宫装、朝服、儒服、戎装、铠甲、盔甲、战袍、袄裤、皮裤、罗裙、翠裙、绣裙
头饰类
凤冠、金冠、斗笠、纱帽、纶巾、束发金箍、雉尾冠、渔婆巾、儒巾、乌纱
鞋履类
花鞋、绣鞋、凤鞋、弓鞋、绣履、罗袜、凤头鞋、红绣鞋
饰品类
金钗、凤钗、金镯、八宝金环、玉佩、珠翠、玳瑁小刀、戳纱荷包、扇套、汗巾、香珠、霞帔、丝绦、步摇、花钿
妆容类
胭脂、香粉、头油、画眉、点唇、搽粉、抹粉、梳妆、妆扮、开脸
缠足类
缠足、三寸金莲、金莲、白绫、白矾、高底
面料类
绫罗、绸缎、白绫、绫袜、锦衣
文件输出
| 文件名 | 大小 | 说明 |
|---|---|---|
| 镜花缘_原文提取.md | 11,249 bytes | 服饰相关原文按回目提取(核心回目精选) |
| 镜花缘_总结.md | 6,414 bytes | 服饰描写分类总结分析 |
| 镜花缘_日志.md | 3,559 bytes | 处理流程与统计日志 |
备注
- 全书最大量服饰描写集中在第32-37回(女儿国),约占全部提取条目的30%。
- 缠足批判是本书服饰描写的核心主题,君子国吴之和的议论与女儿国林之洋的亲历构成言与行双重批判。
- 海外诸国服饰各具特色,以服饰标识国风是本书的叙事策略之一。