《西厢记》服饰提取日志

一、文件信息

  • 输入文件:/home/z/my-project/upload/剧曲/剧曲/西厢记.txt
  • 输出目录:/home/z/my-project/upload/剧曲output/西厢记/
  • 总行数:1300行

二、关键词命中统计

关键词 命中次数 备注
28 含"衣裳""更衣""衣冠""衣架"等
20 含"腰带""裙带""缕带""丝带"等
24 含"丝桐"(琴弦,非织物,需过滤)
25 含"绣鞍""绣旗""绣鞋""绣衾"等
22 罗衣、罗衫、罗裙、罗袖,核心织物
18 锦衾、锦绣、锦帐、锦字等
8 罗裙、翠裙、茜裙
9 纱窗(6次,非服饰)、乌纱帽(2次)
8 金帛、玉帛、绢帛
6 玉簪
6 絮叨(非服饰)、柳絮(非服饰)
7 粗麻线(1次服饰)、其他为比喻用法
7 鸳帐、锦帐
5 布衾、布衣
4 绣旗、旌旗
4 衣裳
4 整冠、衣冠、金冠
3 佩环、环珮
3 前襟、衣襟
2 罗袂
2 巾帼(非服饰)
1 纳履
1 佩环
1 绢帛
1 白练
1 鲛绡
1 绸缪(非织物)
1 旌节
1 纛下
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

三、噪音过滤说明

  1. "丝桐"(L522/L571):指琴弦,非丝织品,已过滤。
  2. "锦绣"(L570/L1082):指文学才华,非织物,标注但保留。
  3. "絮叨"(L723/L1032):为形容词,非絮棉,已过滤。
  4. "纱窗"(L191/L441/L608/L693):为建筑构件,非纱制衣物,标注。
  5. "巾帼":未出现独立用法。
  6. "绸缪"(L892):为动词"缠绵",非绸织物,已过滤。
  7. "丝萝"(L452):比喻婚姻,非丝织品,保留但标注。
  8. "粗麻线"(L660):比喻用法"粗麻线怎透得针关",与缝纫相关,保留。

四、服饰意象链

"衣宽"消瘦链(6处,贯穿全剧)

L232 → L531 → L571 → L1010 → L1046 → L1055

莺莺服饰色彩链

  • 缟素(L76)→ 素罗衣(L955)→ 茜裙(L1046)→ 金冠霞帔(L1214)
  • 白→白→红→金红,色彩变化映射从守孝→相思→团圆

信物链

L1089(汗衫/裹肚/袜/玉簪)→ L1134-1137(逐一咏叹)

五、提取方法

  1. wc -l 确认总行数1300行
  2. 逐关键词 rg -c 统计各词命中数
  3. 组合关键词 rg -n 提取行号及原文
  4. 逐行审读过滤噪音
  5. 分类整理输出

六、输出文件

  • 西厢记_服饰总结.md:分类总结与特征分析
  • 西厢记_原文提取.md:按类别整理的原文摘录
  • 西厢记_提取日志.md:本文件