《连城壁》服饰整理日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 连城壁 |
| 作者 | (清)李渔 |
| 输入文件 | /home/z/my-project/upload/part4/连城壁.txt |
| 文件大小 | 527,695 字节 |
| 总行数 | 1,499 行 |
| 分卷 | 十二卷 |
| 输出目录 | /home/z/my-project/upload/4小说output/连城壁/ |
处理流程
步骤1:文件结构分析
- 确认文件为UTF-8编码(含少量异常字节,用errors='replace'处理)
- 识别12个分卷标记(卷一至卷十二)
- 卷首行号分布:L2, L169, L225, L367, L494, L633, L747, L959, L1061, L1229, L1312, L1397
步骤2:服饰关键词检索
- 使用Python正则表达式进行逐行匹配
- 关键词覆盖:衣裳裙袍衫褂袖冠帽簪钗钿珥环佩绦履鞋袜锦绣绮罗缎绸绢纱绫丝帛氅披风斗篷袄袴裈襦帔霞帔幞巾帕兜囊靴屐项圈手镯臂钏璎珞步摇抹额勒子钏镯珮玉佩金钗银簪珠翠花钿耳坠衿行头戏衣戏装梳妆髻鬟凤冠圆领公服缠头首饰妆奁衣冠等
- 首轮匹配:372行(含大量非服饰用法如"带领""环境""束缚"等)
步骤3:精准筛选
- 优化正则,排除非服饰用法
- 精筛后有效服饰条目:约176条
- 按卷分布:
| 卷 | 条目数 |
|---|---|
| 卷一 | 22 |
| 卷二 | 8 |
| 卷三 | 14 |
| 卷四 | 13 |
| 卷五 | 24 |
| 卷六 | 16 |
| 卷七 | 38 |
| 卷八 | 10 |
| 卷九 | 11 |
| 卷十 | 15 |
| 卷十一 | 5 |
| 卷十二 | 20 |
步骤4:逐卷阅读与标注
- 对每卷服饰相关段落进行精读
- 提取具体服饰名称、材质、用途、社会含义
- 标注行号便于溯源
步骤5:生成输出文件
- 连城壁_总结.md(约11.5KB):逐卷服饰要素表+全书总览
- 连城壁_日志.md(本文件):处理流程记录
- 连城壁_原文提取.md(≤20KB):服饰相关原文摘录
关键发现
1. 戏班服饰体系完整
卷一详细描述了女旦行头、戏箱、缠头等梨园服饰经济体系,是研究清代戏班服饰的珍贵材料。
2. 官民服饰等级鲜明
大红圆领(进士)、凤冠霞帔(命妇)vs 瓦楞帽(皂隶)、破衣破帽(乞丐),服饰等级严格对应社会阶层。
3. 衣物作为叙事道具
- 绣鞋(卷四):鼠衔鞋入壁,引发奸情冤案
- 裙袄褶裤错穿(卷十):鬼神互换衣物,推动情节
- 纱衫vs夹袄(卷十二):薄厚差异成为断案依据
4. 丝绦自缢反复出现
卷五、卷七中丝绦多次作为女性自缢工具,反映当时社会中女性用随身服饰物品寻短的社会现象。
5. 服饰与身份转换
蒋成买时兴衣服改运(卷二)、乞儿方巾绸绢与破衣破帽切换(卷三)、戏子换公服(卷一),服饰改变即身份改变。
处理备注
- 原文含少量编码异常字节(约2处),已用replace策略处理,不影响内容
- 部分关键词如"带""束""环""裹"等泛用性太强,已人工筛选排除非服饰用法
- "绸缪"一词在文中多指"情意殷勤"而非服饰,但卷六"绸缎"为实指绸缎贸易
- "行头"在卷一中特指戏班服装道具,非一般穿着
- 文中"衣冠"出现频繁,多为"衣冠人物""衣冠之器"等借代用法,仅有部分涉及实际服饰
完成时间
2025年处理完成