《元曲选》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 元曲选 |
| 输入文件 | /home/z/my-project/upload/剧曲/剧曲/元曲选.txt |
| 输出目录 | /home/z/my-project/upload/剧曲output/元曲选/ |
| 文件行数 | 13,239 |
| 文件大小 | 4.0MB |
| 执行时间 | 2026-03-05 |
操作记录
步骤1:文件基本检查
wc -l 元曲选.txt # 结果:13239行
ls -lh 元曲选.txt # 结果:4.0MB
mkdir -p 输出目录 # 创建输出目录
步骤2:关键词命中统计
对47个服饰关键词逐一执行 rg -c 统计:
for kw in 衣 裳 冠 带 袍 裘 褐 巾 履 屦 绅 袂 裾 襟 裙 幅 弁 冕 簪 珥 佩 环 绮 罗 纱 绢 帛 锦 绣 练 絮 布 麻 丝 绸 缎 缯 绫 纨 绡 绶 绂 黼 黻 鹖 帻 帷 帐 幄 旗 旌 旆 纛; do
count=$(rg -c "$kw" 元曲选.txt 2>/dev/null || echo 0)
echo "$kw:$count"
done
统计结果:
| 关键词 | 命中 | 关键词 | 命中 | 关键词 | 命中 | 关键词 | 命中 |
|---|---|---|---|---|---|---|---|
| 衣 | 601 | 裳 | 53 | 冠 | 119 | 带 | 967 |
| 袍 | 132 | 裘 | 18 | 褐 | 12 | 巾 | 106 |
| 履 | 29 | 屦 | 2 | 绅 | 2 | 袂 | 23 |
| 裾 | 3 | 襟 | 31 | 裙 | 95 | 幅 | 19 |
| 弁 | 0 | 冕 | 6 | 簪 | 68 | 珥 | 0 |
| 佩 | 37 | 环 | 89 | 绮 | 28 | 罗 | 391 |
| 纱 | 77 | 绢 | 16 | 帛 | 29 | 锦 | 310 |
| 绣 | 366 | 练 | 34 | 絮 | 86 | 布 | 267 |
| 麻 | 145 | 丝 | 131 | 绸 | 17 | 缎 | 0 |
| 缯 | 2 | 绫 | 13 | 纨 | 4 | 绡 | 19 |
| 绶 | 12 | 绂 | 0 | 黼 | 0 | 黻 | 0 |
| 鹖 | 0 | 帻 | 4 | 帷 | 3 | 帐 | 71 |
| 幄 | 2 | 旗 | 85 | 旌 | 24 | 旆 | 0 |
| 纛 | 11 |
零命中词(8个):弁、珥、缎、绂、黼、黻、鹖、旆
步骤3:分关键词提取原文片段
针对高频及实质性服饰关键词,逐一执行 rg -n 提取带行号原文:
rg -n "袍" 元曲选.txt→ 提取132行,筛选实质性约70行rg -n "冠" 元曲选.txt→ 提取119行,筛选实质性约60行rg -n "裘" 元曲选.txt→ 提取18行,全部有实质rg -n "巾" 元曲选.txt→ 提取106行,筛选实质性约50行rg -n "簪" 元曲选.txt→ 提取68行,筛选实质性约35行rg -n "裙" 元曲选.txt→ 提取95行,筛选实质性约50行rg -n "罗" 元曲选.txt(过滤罗网/罗天/罗盘/罗汉)→ 筛选实质性约60行rg -n "绣" 元曲选.txt→ 提取前40行评估rg -n "锦" 元曲选.txt→ 提取前40行评估rg -n "纱|绢|帛|绶|绂|帻|冕|佩|环|绮|绫|纨|绡|褐|袂|裾|襟|绅|屦|练" 元曲选.txt→ 综合提取80行
步骤4:过滤与分类
过滤规则:
1. 排除音注行(如"刨音袍""匏音袍"等反切注音)
2. 排除曲牌名/剧名中的关键词(如"红绣鞋""滚绣球""魔合罗"等)
3. 排除纯修辞义(如"锦心绣口""锦绣前程"等固定搭配中的锦/绣无实物对应)
4. 排除非服饰义(如"带"作动词"带领""携带";"环"作"环绕";"布"作"宣布""布施")
5. 保留有实物服饰描写的段落,即使含修辞色彩
分类框架:
1. 官服体系(紫袍金带、绯袍象简、凤冠霞帔等)
2. 军旅服饰(白袍、锦征袍、鹔鹴裘等)
3. 道服/隐逸服饰(百衲袍、麻绦、草履等)
4. 女性服饰(罗裙、绣鞋、绛绡等)
5. 首饰冠帽(玉簪、金钗、巾帻等)
6. 织物材质(锦、罗、纱、绢等)
7. 特殊服饰关目(绨袍恋恋、裙带缢死等)
步骤5:撰写输出文件
| 文件 | 大小控制 | 说明 |
|---|---|---|
| 元曲选_总结.md | ≤20KB | 分类综述、关键原文引用、学术审查、总结表 |
| 元曲选_原文提取.md | ≤20KB | 带行号原始片段,分类分组,关键词加粗 |
| 元曲选_日志.md | ≤20KB | 完整操作记录(本文件) |
发现与备注
-
高频虚高现象:
带(967)、衣(601)命中最多的两个词,实际服饰义比例不足20%,大量为"带着/带领/衣饭/衣食"等非服饰用法。 -
零命中词分析:弁、珥、缎、绂、黼、黻、鹖、旆共8词零命中。缎在元代尚未普及(元曲时代丝织以罗、绮、绫为主);黼黻为先秦礼服术语,元杂剧白话体系不使用;弁、鹖、旆属特定礼制/军制用语,民间戏剧罕用。
-
金安寿服饰铺排:行5923-5972为全书最详细的服饰描写段落,涉及头巾、绣袍、锦袄、纱巾、罗伞、纱灯等多品类,与其他剧作零散提及形成鲜明对比。
-
绨袍故事:行4386-4431为范雎绨袍故事,"绨袍恋恋"四次出现,是元曲选中服饰作为戏剧关目的典型实例。
-
裙带缢死:行5619-5693赵氏孤儿中公主以裙带自缢,"裙带"出现4次,服饰元素直接参与剧情推进。
-
元杂剧十二科中"披袍秉笏"列为第三科(行805),说明袍笏为元杂剧重要扮装类型。
-
院本服饰记载:行238记载宋徽宗时爨国人"衣装鞵履巾裹傅粉墨",为研究宋元戏剧服饰提供了珍贵史料。