梦窗稿 服饰整理工作日志
任务信息
| 项目 | 内容 |
|---|---|
| 任务类型 | txt服饰逐本整理 |
| 处理对象 | 《梦窗稿》(南宋·吴文英) |
| 输入文件 | /home/z/my-project/upload/词集/词集/梦窗稿.txt |
| 输出目录 | /home/z/my-project/upload/词集output/梦窗稿/ |
| 执行时间 | 2026-03-05 |
处理流程
第一步:文本读取与结构识别
- 读取全文,共1382行
- 识别文本结构:书名行→分卷(卷一/卷二/卷三/卷四补笺)→词牌名→题序→正文
- 卷一:自"琐窗寒"至"法曲献仙音"(约265行)
- 卷二:自"还京乐"至"凤池吟"(约310行)
- 卷三:自"洞仙歌"至"夜行船"(约430行)
- 卷四补笺:自"柳梢青"至"蹋莎行"(约340行)
第二步:服饰词汇识别
- 采用关键词扫描法,对以下类别逐一检索:
- 衣裳类:袍、裘、衫、裙、被、衾、裳、帏、幄、帷
- 冠帽类:帽、冠、巾、帻、纱
- 佩饰类:钗、钿、佩、环、珰、簪、翘、梳、钏、带
- 履袜类:履、屦、屐、袜
- 妆扮类:妆、黛、粉、脂、唇、鬟、髻、眉
- 丝织品类:绡、罗、绮、纱、锦、绣、纨、缟、绫
- 扇帨类:扇、巾、帕、囊
- 其他:帘、屏、蓑、笠
第三步:逐词标注与分类
- 对每条服饰词标注:词牌名、题序、原文语境、所属分类
- 共识别286条服饰词出现(含重复词牌中的复现)
- 去重后独立词汇约180个
第四步:特征分析与统计
- 统计各分类频次
- 分析"绣"字构词体系(约30见)
- 对比同时代词人(姜夔、周邦彦)的服饰词密度
- 归纳吴文英服饰书写五大特征
第五步:撰写三份输出文件
- 梦窗稿_总结.md:分类统计+特征分析+横向比较+核心发现
- 梦窗稿_日志.md:处理流程+检索记录+疑难说明
- 梦窗稿_原文提取.md:按分类逐条辑录原文语境
检索记录
| 检索关键词 | 命中条数 | 备注 |
|---|---|---|
| 绣 | 32 | 含绣帘、绣幌、绣网等 |
| 罗 | 28 | 含罗裙、罗屏、罗扇等 |
| 钗 | 18 | 含钗股、宝钗、钿钗等 |
| 帘 | 22 | 含绣帘、画帘、红帘等 |
| 屏 | 16 | 含罗屏、锦屏、翠屏等 |
| 裘 | 5 | 貂裘3、暖袍1、宫袍1 |
| 帽 | 14 | 乌帽3、狸帽1、簪花帽1等 |
| 妆 | 16 | 妆面、啼妆、半妆等 |
| 鬟 | 12 | 愁鬟、堕鬟、连鬟等 |
| 绡 | 11 | 冰绡、鲛绡、红绡等 |
| 霓裳 | 4 | 仙服意象 |
| 佩/环 | 14 | 佩环、环佩、湘佩等 |
| 裙 | 10 | 翠裙、行裙、罗裙等 |
| 翠翘 | 3 | 首饰高频词 |
| 纨扇/团扇 | 5 | 扇类 |
疑难与说明
1. 残缺字处理
原文中存在若干"□"号表示的残缺字,如:
- "□遗芳掩色"(琐窗寒)
- "□华峰□□"(瑞鹤仙·赠道女)
- "轻冰润□"(夜飞鹊)
- "空忆双蝉□翠"(婆罗门引)
凡残缺字涉及服饰词者,已在原文提取中标注"□"保留,不作臆补。
2. 边界词判定
- "翠微":部分用例指山色,部分与"翠微高处"(登高)关联帽饰语境,分别归入
- "金屋":既指建筑又暗含"金屋藏娇"服饰/居室双重意象,归入居室-服饰交叉类
- "凌波":既为步态又暗含"凌波袜"典故,归入履袜类
3. 词牌重复处理
同一词牌名多次出现(如瑞鹤仙8首、水龙吟9首、齐天乐8首),各首分别标注,不作合并。
4. "绣"字构词统计
"绣"字在梦窗稿中构词能力极强,统计如下:
- 绣帘(4见)、绣网、绣络、绣屋、绣被、绣户、绣槛、绣囊、绣圈、绣针、绣漪、绣幌、绣帷、绣墩——共约32见
输出文件清单
| 文件名 | 内容 | 状态 |
|---|---|---|
| 梦窗稿_总结.md | 分类统计+特征分析+比较+发现 | ✓已完成 |
| 梦窗稿_日志.md | 处理流程+检索记录+疑难说明 | ✓已完成 |
| 梦窗稿_原文提取.md | 按分类逐条辑录原文语境 | 待完成 |