《六十种曲投梭记》服饰提取日志

一、文件信息

  • 输入文件:/home/z/my-project/upload/剧曲/剧曲/六十种曲投梭记.txt
  • 输出目录:/home/z/my-project/upload/剧曲output/六十种曲投梭记/
  • 总行数:1421行

二、关键词命中统计

关键词 命中次数 备注
30 含"衣裳""更衣""衣冠""布衣""衣锦""衣饭"等
29 含"腰带""裙带""锦带""带甲"等
29 含"锦绣""锦衣""锦帐""锦带"等
18 含"绣花""绣纹""绣帘"等
16 军旗为主
14 含"玉帐""斗帐""锦帐"等
10 军旗类
10 "麻苍蝇"(比喻,非服饰)等
9 含"青丝""丝纶"等
9 含"布衣""布使""裙布"等
7 含"绫罗"等
6 含"环佩"等
5 翠裙、红裙、裙钗、裙布
4 粟帛、梧帛、玉帛
4 羊裘、貂裘、裘帽
4 含"纱帽""牕纱"
4 角巾、纶巾
8 含"冠服""衣冠""貂冠"等
4 羊裘、貂裘、裘帽
2 锦绢、衣绢
2 绫罗
2 紫绶、冠和绶
1 边幅(比喻)
1 冠绅
1 襟裾
1 襟裾
3 腰间佩、佩双钩、环佩
2 朝簪
1 云绮
2 净练、捣练
5 絮聒(非服饰)、絮酒
1 卷旆
1 彩纛
1 冠绅
3 袍服
2 冰霜履、不衫不履
0
0
0
0
0
0
0
0
0

三、噪音过滤说明

  1. "衣饭"(L218/L471):指"生计",非衣物,已标注。
  2. "麻苍蝇"(L574):比喻用法,非麻织物,已过滤。
  3. "边幅"(L773):"边幅好丰裁",比喻仪表,非布帛,已标注。
  4. "絮聒"(L467/L929/L1237):为动词"唠叨",非絮棉,已过滤。
  5. "絮酒"(L851):炙鸡絮酒,为祭品用语,保留但标注。
  6. "丝纶"(L475):指诏书,非丝织品,标注。
  7. "青丝"(L249):指头发,非丝织品,标注。
  8. "带甲"(L155):指披甲士兵,非腰带,标注。

四、核心服饰意象链

谢鲲袍服链

L165(袍服换酒)→ L169(袍服换酒被提及)→ L549(赐章服一袭)→ L551(更衣)→ L553(貂余季子裘)→ L775(解却朝衫,角巾归第)

女性贞节服饰链

L155(裙布钗荆)→ L218(何须拣食穿衣绢)→ L765(女裙钗)→ L1334(汨水裙钗)

贫富服饰对比

L471(衣服殷,多补绽)vs L449(绫罗锦绢则当布使)

五、提取方法

  1. wc -l 确认总行数1421行
  2. 逐关键词 rg -c 统计各词命中数
  3. 组合关键词 rg -n 提取行号及原文
  4. 逐行审读过滤噪音
  5. 分类整理输出

六、输出文件

  • 投梭记_服饰总结.md:分类总结与特征分析
  • 投梭记_原文提取.md:按类别整理的原文摘录
  • 投梭记_提取日志.md:本文件