曲律 —— 服饰提取日志
基本信息
- 输入文件:/home/z/my-project/upload/剧曲/剧曲/曲律.txt
- 总行数:1112行
- 输出目录:/home/z/my-project/upload/剧曲output/曲律/
提取过程
第一轮:全词库grep
- 命令:
rg -n '衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛' - 命中行数:约150行
- 噪音极高:约96%为曲牌名罗列,如【皂罗袍】【锦缠道】等
第二轮:精确短语grep
- 命令:
rg -n '玉抱肚|绿襕|绣带|绣衣|青衲|红衲|皂罗袍|罗带|锦衣香|罗帐|白练序|捣练|彩旗|绣停针|绣鸳鸯|红衫|红绣鞋|朱履|羊头靴|红罗袄|销金帐' - 命中行数:约30行
- 仍以曲牌名罗列为主
第三轮:真实服饰内容grep
- 命令:
rg -n '帐中|抱肚|玉抱肚|唐人呼带|绿襕衫|绿襕踢|朱履曲|羊头靴|脱银袍|缇|缠头锦|彩扇|颠倒衣裳' - 命中行数:约8行
- 有效信息集中于此
噪音过滤
- 主要噪音源:曲牌名罗列(行38-384之间,约350行曲谱)
- 这些行中【皂罗袍】【绣带儿】【锦缠道】等仅是调名,非服饰描写
- 但部分曲牌名本身蕴含服饰文化信息,已分类整理于原文提取
- 已过滤:
- "丝肉"(行12):指音乐,非服饰
- "红牙"(行12):拍板,非服饰
- "布法"(行12):布施法度
- "绣刻"类:无此噪音
- "旗帜"在曲牌名中:仅列名,已归入曲牌汇总
- 保留但标注:
- 曲牌名中的服饰字保留于"曲牌名汇总"部分
- 【玉抱肚】考源保留为核心考据
- "缠头锦"保留为歌场服饰用语
特殊说明
本书为曲学理论著作,服饰内容极少。与剧曲类文本不同,曲律中的服饰关键词几乎全部出现在曲牌名中。仅2处具有真正的服饰考据价值:
1. 【玉抱肚】条:记录了"唐人呼带为抱肚"及宋真宗赐王安石玉抱肚的史实
2. 【红绣鞋】条:记录了同一曲调的三个异名(朱履曲/羊头靴/红绣鞋),反映鞋履称谓的多样性
提取统计
| 类别 | 命中行数 | 过滤后 |
|---|---|---|
| 曲牌名服饰字 | ~150 | ~150(归入曲牌汇总) |
| 正文服饰论述 | 8 | 6 |
| 噪音(丝肉/红牙/布法等) | 5 | 0 |
| 有效服饰信息 | 8 | 6 |
验证
- 关键词覆盖率:词库48字中命中24字
- 未命中词:裳、褐、屦、绅、袂、裾、襟、幅、弁、冕、珥、絮、绸、缎、缯、绫、纨、绶、绂、黼、黻、鹖、帻、旆、纛
- 输出文件大小检查:总结.md、原文提取.md、日志.md 均 < 20KB ✓