远山堂曲品 服饰提取日志
基本信息
- 输入文件:/home/z/my-project/upload/剧曲/剧曲/远山堂曲品.txt
- 输出目录:/home/z/my-project/upload/剧曲output/远山堂曲品/
- 文件总行数:1135行
- 处理时间:2026-03-04
处理步骤
第1步:关键词频次扫描
使用服饰关键词词库(衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛),逐一grep -c统计频次。
命中关键词及频次:
衣(9) 裳(3) 冠(4) 带(10) 袍(7) 裘(4) 巾(1) 履(2) 绅(3) 襟(2) 裙(2) 弁(1) 冕(1) 簪(5) 佩(6) 环(10) 绮(5) 罗(14) 纱(4) 锦(10) 绣(6) 练(7) 絮(2) 布(2) 麻(1) 丝(5) 纨(1) 绡(1) 绶(3) 帐(1) 旗(2)
未命中关键词:褐、屦、袂、裾、幅、珥、绢、帛、绸、缎、缯、绫、绂、黼、黻、鹖、帻、帷、幄、旌、旆、纛
第2步:全量grep
使用正则 衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛 进行grep -n,命中120行。
第3步:精细化过滤
对120行原始结果进行人工审阅,分类处理:
噪音过滤规则:
1. 单字"环"出现在人名/地名中(如"玉环"为曲名、人名),需结合上下文判断
2. "带"在"映带""牵带"等动词用法中不属服饰
3. "衣"在"天衣无缝"等比喻中标注但不过滤
4. "罗"在"罗致""罗列"等动词用法中不属服饰
5. "丝"在"红丝"中多为定情物而非织物
6. "旗"仅在"旗亭"曲名中出现,与军事旗帜无关
7. "环"大量出现在曲名中(紫环、双环、玉环、金环、镶环、连环),为器物
有效服饰条目:
- 剧名含服饰器物:约35条
- 评述中的服饰描写:约14条
- 军旅旗帜类:2条
- 总计有效条目:约51条
第4步:输出文件
- 总结.md:分类总结,含统计表和文化特征分析
- 原文提取.md:按行号排列的原文条目,不做转述
- 日志.md:本文件
特殊发现
- 本书中"貂蝉冠"(第1092行)是少有的具体冠制记载
- "青衣"三次出现均指婢女身份,非颜色描写
- 大量剧名以佩饰器物为题(簪、环、佩、绶、囊等),反映明代传奇以信物串联情节的叙事传统