梦窗稿 服饰整理工作日志

任务信息

项目 内容
任务类型 txt服饰逐本整理
处理对象 《梦窗稿》(南宋·吴文英)
输入文件 /home/z/my-project/upload/词集/词集/梦窗稿.txt
输出目录 /home/z/my-project/upload/词集output/梦窗稿/
执行时间 2026-03-05

处理流程

第一步:文本读取与结构识别

第二步:服饰词汇识别

第三步:逐词标注与分类

第四步:特征分析与统计

第五步:撰写三份输出文件

  1. 梦窗稿_总结.md:分类统计+特征分析+横向比较+核心发现
  2. 梦窗稿_日志.md:处理流程+检索记录+疑难说明
  3. 梦窗稿_原文提取.md:按分类逐条辑录原文语境

检索记录

检索关键词 命中条数 备注
32 含绣帘、绣幌、绣网等
28 含罗裙、罗屏、罗扇等
18 含钗股、宝钗、钿钗等
22 含绣帘、画帘、红帘等
16 含罗屏、锦屏、翠屏等
5 貂裘3、暖袍1、宫袍1
14 乌帽3、狸帽1、簪花帽1等
16 妆面、啼妆、半妆等
12 愁鬟、堕鬟、连鬟等
11 冰绡、鲛绡、红绡等
霓裳 4 仙服意象
佩/环 14 佩环、环佩、湘佩等
10 翠裙、行裙、罗裙等
翠翘 3 首饰高频词
纨扇/团扇 5 扇类

疑难与说明

1. 残缺字处理

原文中存在若干"□"号表示的残缺字,如:
- "□遗芳掩色"(琐窗寒)
- "□华峰□□"(瑞鹤仙·赠道女)
- "轻冰润□"(夜飞鹊)
- "空忆双蝉□翠"(婆罗门引)

凡残缺字涉及服饰词者,已在原文提取中标注"□"保留,不作臆补。

2. 边界词判定

3. 词牌重复处理

同一词牌名多次出现(如瑞鹤仙8首、水龙吟9首、齐天乐8首),各首分别标注,不作合并。

4. "绣"字构词统计

"绣"字在梦窗稿中构词能力极强,统计如下:
- 绣帘(4见)、绣网、绣络、绣屋、绣被、绣户、绣槛、绣囊、绣圈、绣针、绣漪、绣幌、绣帷、绣墩——共约32见

输出文件清单

文件名 内容 状态
梦窗稿_总结.md 分类统计+特征分析+比较+发现 ✓已完成
梦窗稿_日志.md 处理流程+检索记录+疑难说明 ✓已完成
梦窗稿_原文提取.md 按分类逐条辑录原文语境 待完成