六十种曲绣襦记 服饰提取日志

处理信息

  • 输入文件:/home/z/my-project/upload/剧曲/剧曲/六十种曲绣襦记.txt
  • 输出目录:/home/z/my-project/upload/剧曲output/六十种曲绣襦记/
  • 文件大小:145,115 bytes
  • 总行数:903行
  • 处理日期:2026-03-05

处理流程

第一步:行数统计

wc -l → 903行

第二步:关键词覆盖扫描

使用服饰关键词词库(52字)逐一grep统计命中行数:

关键词 命中行数 关键词 命中行数 关键词 命中行数
33 25 6
30 18 6
17 8 1
10 8 1
10 7 1
14 4 1
5 3 1
2 4 2
2 3 2
4 2 1
1 2 4
1 0 0
0 0 0
1 0 0
0 0 0
0 0 0
0 0 0

总命中行数(去重):约145行

第三步:精准提取

使用复合关键词模式精准提取,过滤噪音:
- 排除纯虚词用法(如"环"作环绕义)
- 排除与服饰无关的"旗"(仅1处为旗帜义)
- 保留"帐"作帷帐义(8处中锦帐3处、芙蓉帐2处)

第四步:分类整理

将提取内容按7类整理:
1. 上层社会服饰(官员、公子)
2. 风月场所服饰(妓家)
3. 儒生服饰
4. 乞丐服饰(重点)
5. 昔日富家公子服饰(回忆/对比)
6. 婚嫁服饰
7. 面料与工艺

第五步:输出验证

  • 总结.md:5,759 bytes ✓ (<20KB)
  • 原文提取.md:5,759 bytes ✓ (<20KB)
  • 日志.md:<20KB ✓

噪音过滤说明

过滤类型 示例 说明
虚词"带" "地带"、"带月" 仅保留"腰带"、"同心带"等服饰义
虚词"环" "环绕"、"回环" 仅保留"环佩"、"大巾环"等饰物义
虚词"旗" "旗常列" 此处为旗帜义但属仪仗服饰关联,保留
"丝"泛指 "丝桐"、"丝缰" 乐器/马具,非服饰,过滤
"布"地名 "布政里" 地名非面料,过滤
"帛"祭祀 "纸帛" 祭祀用品,非服饰面料,过滤

服饰意象特征

本剧服饰描写最突出特征为对比叙事
- 上半部:纻丝袄、白玉钩、琥珀珠 → 富家公子
- 中段:破布衫、烂丝麻、歪乌辣 → 落魄乞丐
- 下半部:绿袍、凤冠霞帔 → 科举功名

"绣襦"作为核心意象贯穿全剧:从亚仙亲手绣制→元和典当流落→亚仙解襦护寒→终成婚配。