《新编杨椒山表忠蚺蛇胆》服饰提取日志


基本信息

项目 内容
输入文件 /home/z/my-project/upload/剧曲/剧曲/新编杨椒山表忠蚺蛇胆.txt
输出目录 /home/z/my-project/upload/剧曲output/新编杨椒山表忠蚺蛇胆/
文件行数 882行
文件大小 176,360字节(约172KB)
服饰词库 衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛(共56字)
处理时间 2026-03-04

处理流程

第一轮:全词库扫描

使用ripgrep对56个服饰关键词进行全文扫描,初始命中199行

rg -n '衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛'

第二轮:分组精细化检索

将56个关键词分为6组,逐组检索并记录行号:

组号 关键词 命中行数
1 45
2 裳、冠、袍、裘、褐、巾、履、屦 52
3 带、绅、袂、裾、襟、裙、幅、弁、冕 41
4 簪、珥、佩、环、绮、罗、纱、绢、帛 31
5 锦、绣、练、絮、布、麻、丝、绸、缎、缯 49
6 绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛 28

第三轮:扩展检索

针对初筛中发现的高频组合词与舞台指示,进行扩展检索:

  • 搜索具体服饰词:素妆、儒服、吉服、蟒玉、蟒衣、蟒服、便服、便衣、罪衣、囚服、更衣、脱衣、衣冠、素服、戎装、法服、黄衣、金甲、锦衣、纱帽、幞头、冠带、角带、青衣、白须、吏巾、素冠、圆帽、冠帔、蟒缎、绒褐、姑绒、鲛绡、锦帕、荆布、丝麻、绩絮、京绢、苏州绢、白布、麻衣、红裙、翠袖、袖长、皂罗、舞霓裳、鹤氅、香叶冠、黄冠、象简紫袍、宽袍、紫袍、黑袍、白袍、红袍、貂裘、敝裘、狐裘、羊裘、旗幡、旗帜、黄旗、黑旗、白旗

第四轮:噪音过滤

以下命中项经判定为噪音,予以剔除:

噪音类型 示例 剔除原因
机构名 锦衣卫(L197、L206、L211等) 衙署名称,非服饰
序言标题 弁言(L4、L52) "弁"作序言解,非冠帽
建筑用语 环堵萧然(L109) "环堵"指围墙,非佩环
药物用语 麻药一般(L588) "麻"指麻醉,非纺织
音乐用语 丝管(L307) "丝"指丝弦乐器
文学典故 擊绣之辞(L54) "绣"喻文辞修饰
纺织泛指 绸缪(L238) "绸缪"为成语,非织物
出目名称 双调家麻韵(L30) 韵部名,与服饰无关
姓名用字 麻(麻衣为丧服保留) 部分保留

第五轮:分类整理

将过滤后的有效条目按14个类别整理:
1. 官服体系(蟒玉、冠带、纱帽、幞头、朝服、角带等)
2. 儒生文人服(儒服、儒冠、青衫、巾服、释褐)
3. 吉服/便服
4. 囚服/罪衣
5. 素服/丧服
6. 民间织物与纺织劳动
7. 番邦/少数民族服饰
8. 女性服饰
9. 宗教/神灵服饰
10. 军事/仪仗服饰
11. 首饰佩饰
12. 裘服/皮衣
13. 衣冠剥落叙事
14. 其他服饰相关


服饰关键词命中统计

关键词 命中次数 有效服饰条目 噪音条目
45 28 17(锦衣卫、衣食等)
31 25 6
22 18 4
8 8 0
4 4 0
7 7 0
2 2 0
3 3 0
4 4 0
2 2 0
3 3 0
5 3 2
12 9 3
3 3 0
3 3 0
4 4 0
8 5 3
6 3 3
3 3 0
3 3 0
2 2 0
9 9 0
4 4 0
1 1 0
3 2 1
1 1 0
其他(未命中) 0 0 0

未命中关键词:裳(单独)、履、屦、袂、幅、弁(服饰义)、冕、珥、绮、帛、练、绸、缯、绫、纨、绂、黼、黻、鹖、帻、帷、幄、纛


输出文件清单

文件名 内容 大小
01_总结.md 服饰内容分类总结与场景分析 ≤20KB
02_原文提取.md 按类别整理的原文服饰条目(含行号) ≤20KB
03_日志.md 处理流程与过滤记录(本文件) ≤20KB

注意事项

  1. 本剧"锦衣卫"出现极频(约20次),绝大多数为衙署名称,非服饰义项,已过滤。
  2. "冠带"在剧中主要作为舞台角色出场指示(如"丑冠带上"),既属服饰描写,又具戏剧功能,均予保留。
  3. "弁"仅在"弁言"(序言标题)中出现,非冠帽义,已剔除。
  4. 姑绒/绒褐为甘肃狄道地方特产织物,剧中第十七出化番有详细描写,与杨椒山任典史禁征褐的史实相关,具有重要民俗价值。
  5. 神灵服饰(黑袍、白袍、红袍)在第十九出醮警中形成色彩编码系统,与善恶判断对应,为明代宗教戏剧服饰的典型范例。