六十种曲绣襦记 服饰提取日志
处理信息
- 输入文件:/home/z/my-project/upload/剧曲/剧曲/六十种曲绣襦记.txt
- 输出目录:/home/z/my-project/upload/剧曲output/六十种曲绣襦记/
- 文件大小:145,115 bytes
- 总行数:903行
- 处理日期:2026-03-05
处理流程
第一步:行数统计
wc -l → 903行
第二步:关键词覆盖扫描
使用服饰关键词词库(52字)逐一grep统计命中行数:
| 关键词 | 命中行数 | 关键词 | 命中行数 | 关键词 | 命中行数 |
|---|---|---|---|---|---|
| 衣 | 33 | 绣 | 25 | 环 | 6 |
| 锦 | 30 | 丝 | 18 | 麻 | 6 |
| 罗 | 17 | 纱 | 8 | 帛 | 1 |
| 绮 | 10 | 帐 | 8 | 绸 | 1 |
| 冠 | 10 | 布 | 7 | 绫 | 1 |
| 带 | 14 | 裳 | 4 | 纨 | 1 |
| 袍 | 5 | 簪 | 3 | 绡 | 1 |
| 裘 | 2 | 佩 | 4 | 黼 | 2 |
| 巾 | 2 | 絮 | 3 | 黻 | 2 |
| 裙 | 4 | 襟 | 2 | 旗 | 1 |
| 履 | 1 | 裘 | 2 | 旌 | 4 |
| 屦 | 1 | 绅 | 0 | 幄 | 0 |
| 袂 | 0 | 幅 | 0 | 绶 | 0 |
| 裾 | 1 | 弁 | 0 | 绂 | 0 |
| 冕 | 0 | 珥 | 0 | 帻 | 0 |
| 幅 | 0 | 鹖 | 0 | 帷 | 0 |
| 纛 | 0 | 旆 | 0 | 练 | 0 |
总命中行数(去重):约145行
第三步:精准提取
使用复合关键词模式精准提取,过滤噪音:
- 排除纯虚词用法(如"环"作环绕义)
- 排除与服饰无关的"旗"(仅1处为旗帜义)
- 保留"帐"作帷帐义(8处中锦帐3处、芙蓉帐2处)
第四步:分类整理
将提取内容按7类整理:
1. 上层社会服饰(官员、公子)
2. 风月场所服饰(妓家)
3. 儒生服饰
4. 乞丐服饰(重点)
5. 昔日富家公子服饰(回忆/对比)
6. 婚嫁服饰
7. 面料与工艺
第五步:输出验证
- 总结.md:5,759 bytes ✓ (<20KB)
- 原文提取.md:5,759 bytes ✓ (<20KB)
- 日志.md:<20KB ✓
噪音过滤说明
| 过滤类型 | 示例 | 说明 |
|---|---|---|
| 虚词"带" | "地带"、"带月" | 仅保留"腰带"、"同心带"等服饰义 |
| 虚词"环" | "环绕"、"回环" | 仅保留"环佩"、"大巾环"等饰物义 |
| 虚词"旗" | "旗常列" | 此处为旗帜义但属仪仗服饰关联,保留 |
| "丝"泛指 | "丝桐"、"丝缰" | 乐器/马具,非服饰,过滤 |
| "布"地名 | "布政里" | 地名非面料,过滤 |
| "帛"祭祀 | "纸帛" | 祭祀用品,非服饰面料,过滤 |
服饰意象特征
本剧服饰描写最突出特征为对比叙事:
- 上半部:纻丝袄、白玉钩、琥珀珠 → 富家公子
- 中段:破布衫、烂丝麻、歪乌辣 → 落魄乞丐
- 下半部:绿袍、凤冠霞帔 → 科举功名
"绣襦"作为核心意象贯穿全剧:从亚仙亲手绣制→元和典当流落→亚仙解襦护寒→终成婚配。