《魏忠贤小说斥奸书》服饰整理日志
基本信息
| 项目 | 内容 |
|---|---|
| 任务编号 | batch18-4 |
| 输入文件 | /home/z/my-project/upload/part4/魏忠贤小说斥奸书.txt |
| 输出目录 | /home/z/my-project/upload/4小说output/魏忠贤小说斥奸书/ |
| 文件编码 | UTF-8 |
| 文件大小 | 280,650字节 |
| 总行数 | 742行(含空行) |
| 实际文本行 | 约650行 |
处理流程
第一步:文件检测与目录创建
- 确认输入文件存在,大小约274KB
- 创建输出目录
mkdir -p /home/z/my-project/upload/4小说output/魏忠贤小说斥奸书/
第二步:编码检测
- 文件为UTF-8编码,但存在个别字节异常(位置约135167/166301处)
- 使用
errors='replace'参数处理异常字节
第三步:服饰关键词检索
使用以下关键词列表进行全文扫描:
上衣类:衣、袍、裳、衫、褂、袄、裘 下衣类:裙 头饰类:冠、帽、巾、弁、幞 足衣类:履、靴、鞋、屐 带饰类:带、佩、饰 首饰类:簪、钗、环、珮、钿 织物类:锦、绣、绫、罗、绸、缎、纱、绢、帛、褐 甲胄类:铠、甲、盔 其他:蟒、鹤、冕、氅、抹额、荷包、香囊、朝珠、霞帔、丝绦、百家衣、红绣鞋
第四步:检索结果统计
| 类别 | 命中行数 | 说明 |
|---|---|---|
| 官服品级 | 约35行 | 蟒衣、玉带、锦衣、朝服、冕服等 |
| 武服甲胄 | 约12行 | 绣甲、明盔明甲、金甲红袍等 |
| 日常/民间 | 约18行 | 短衣、袍、衫、巾、帽、履等 |
| 女性服饰 | 约12行 | 裙、钗、绣带、佩环等 |
| 织物材料 | 约15行 | 缎、绫、锦、绣等 |
| 仪仗特殊 | 约10行 | 百家衣、缀珠云履、锦褥等 |
| 非服饰(排除) | 约22行 | "罗"作人名/网罗、"锦"作地名、"甲"作甲子等 |
| 合计有效 | 约100行 | — |
第五步:排除非服饰用例
以下为关键词命中但非服饰含义的用例,已排除: - "罗":罗刹狂人(人名)、网罗、罗织、罗钳吉网 - "锦":锦州(地名)、锦宁(地名) - "甲":甲子(干支)、甲兵(军事泛称) - "丝":丝竹(音乐)、朱丝(琴弦) - "履":履历、履霜冰至(成语) - "环":投环(自缢)、循环 - "弁":武弁(武官泛称) - "饰":整饰(整治)、修饰 - "坠":坠落(动词)
第六步:原文提取与分类
对100条有效服饰相关行,逐条提取上下文(前后各2行),按回目归入对应章节,最终整理为原文提取文档。
服饰描写分布
| 卷 | 回目范围 | 服饰描写密度 | 代表性服饰 |
|---|---|---|---|
| 卷一 | 第1-5回 | ★★★★ | 箨箬冠、栗色袍、蟒厂衣、绣袄紫衫、短衣小袖、绣甲 |
| 卷二 | 第6-10回 | ★★★ | 石榴裙、素衣角带、百家衣、绣衣 |
| 卷三 | 第11-15回(缺13-21回) | ★★ | 绨袍、红绣鞋、裘马、儒衣僧帽道人鞋 |
| 卷四 | 第16-20回(存目缺文) | — | — |
| 卷五 | 第21-25回 | ★★★ | 高巾大袖、绫袜红鞋、棋子帽、时服、衣巾 |
| 卷六 | 第26-30回 | ★★★★★ | 蟒为衣玉为带、端冕承旒、锦褥、缀珠云履、金镶玉带、锦衣花帽、金甲红袍、大帽曳撒 |
| 卷七 | 第31-34回 | ★★★ | 进贤冠、绛纱、衣冠济济、朱裳贝带、鵕冠、金盔猊铠、冕服 |
| 卷八 | 第35-40回(缺35-40回) | ★ | 玉带蟒服改金带虎豹补子 |
输出文件清单
| 文件名 | 大小 | 说明 |
|---|---|---|
| 魏忠贤小说斥奸书_总结.md | ≤20KB | 服饰分类总结与叙事分析 |
| 魏忠贤小说斥奸书_日志.md | ≤20KB | 处理流程与统计记录 |
| 魏忠贤小说斥奸书_原文提取.md | ≤20KB | 服饰相关原文逐条摘录 |
备注
- 本书原缺第13-21回、第35-40回,共15回内容无法检索。
- 书中"蟒衣玉带"为最高频服饰组合(出现10余次),贯穿全书始末。
- 服饰描写集中于卷一(发迹)和卷六(极盛),叙事功能显著。
- 部分关键词(如"罗""锦""甲")多用于非服饰语境,需人工甄别。