《全元曲杂剧》服饰内容提取日志
基本信息
| 项目 | 值 |
|---|---|
| 输入文件 | /home/z/my-project/upload/剧曲/剧曲/全元曲杂剧.txt |
| 输出目录 | /home/z/my-project/upload/剧曲output/全元曲杂剧/ |
| 书名 | 全元曲杂剧 |
| 总行数 | 29,595行 |
| 文件大小 | 5.9MB |
| 处理时间 | 2026年3月4日 |
操作记录
步骤1:文件基本信息获取
- 命令:
wc -l→ 29,595行 - 命令:
ls -lh→ 5.9MB - 创建输出目录:
mkdir -p
步骤2:关键词命中统计
对44个服饰关键词逐一执行 rg -c 统计,结果如下:
| 关键词 | 命中行数 | 关键词 | 命中行数 | 关键词 | 命中行数 |
|---|---|---|---|---|---|
| 衣 | 953 | 裳 | 73 | 冠 | 168 |
| 带 | 1279 | 袍 | 249 | 裘 | 32 |
| 褐 | 13 | 巾 | 117 | 履 | 69 |
| 屦 | 1 | 绅 | 7 | 袂 | 35 |
| 裾 | 5 | 襟 | 57 | 裙 | 131 |
| 幅 | 26 | 弁 | 0 | 冕 | 8 |
| 簪 | 71 | 珥 | 0 | 佩 | 31 |
| 环 | 143 | 绮 | 35 | 罗 | 503 |
| 纱 | 114 | 绢 | 28 | 帛 | 45 |
| 锦 | 489 | 绣 | 619 | 练 | 70 |
| 絮 | 127 | 布 | 460 | 麻 | 196 |
| 丝 | 216 | 绸 | 33 | 缎 | 9 |
| 缯 | 3 | 绫 | 20 | 纨 | 3 |
| 绡 | 30 | 绶 | 26 | 绂 | 0 |
| 黼 | 0 | 黻 | 0 | 鹖 | 0 |
| 帻 | 3 | 帷 | 12 | 帐 | 167 |
| 幄 | 14 | 旗 | 232 | 旌 | 66 |
| 旆 | 3 | 纛 | 14 |
零命中关键词:弁、珥、绂、黼、黻、鹖(6个)
步骤3:实质性服饰段落提取
3.1 袍(249命中)
- 执行
rg -n "袍"提取全文行号,人工筛选有实质服饰描写的段落 - 重点提取:紫袍/绿袍/锦袍/虎皮袍/襕袍/麻袍/绨袍相关
- 代表性发现:
- 行196:紫袍郎/白衣相(功名对比)
- 行1178:虎皮妆就锦袍新(武将装束)
- 行1205:虎皮袍、虎磕脑、铁燕挝(遗物)
- 行2199:绿袍槐简(探花郎)
- 行2230:紫袍象简/紫袍金带/绿袍官职小(官服等级)
- 行3508:青衲袄/紫罗袍(隐逸vs仕途)
- 行3576-3649:绨袍故事(7处)
- 行4229/4274:靴笏襕袍(状元被贬)
- 行5956:布袍/纶巾(隐士)
- 行1325:麻袍(退隐)
- 行6498:锦貂裘改汉宫妆(民族服饰)
3.2 裙(131命中)
- 执行
rg -n "裙"全文提取 - 过滤修辞后保留约35条实质性描写
- 代表性发现:
- 行1501:藕丝翡翠裙(极华丽)
- 行1647:大红罗裙子绣鞋儿弯
- 行4972/5019/5554/5556/8910/8918(西厢记系列裙装描写)
- 行8088:翠裙鸳绣金莲小
- 行4498:罗裙簌绛纱
- 行6038:茜裙罗袜缕金裳
- 行6629:布裙踏竹马(童趣)
- 行7255:夜叉裙(丑角)
3.3 冠/巾/裘/簪/履/绶/帻等
- 冠:重点提取"儒冠""凤冠""金冠""衣冠"等复合词,发现168命中中约40%为实质服饰描写
- 巾:重点提取"头巾""纶巾""幅巾""巾帻",117命中中约20%为实质服饰
- 裘:32命中几乎全部为实质服饰(貂裘/鹔鸘裘/轻裘/狐裘),保留率高
- 簪:71命中中约60%为实质首饰描写(玉簪/花簪/簪缨)
- 履:69命中含"织履编席""草履""朱履""进履"等,约40%实指
- 绶:26命中多与"紫绶金章"关联,高度实指
- 帻:仅3命中,全部实指
3.4 复合词专项搜索
- 执行
rg -n "衣冠|布衣|锦衣|紫衣|白衣|铁衣"搜索 - 发现460命中,大量为"布衣"(寒儒身份标志)和"衣冠"(士大夫代称)
- "铁衣"为武将铠甲代称,实指性强
步骤4:内容分类与整理
将提取内容按8大类组织:
1. 官服制度(紫袍/绿袍/靴笏襕袍/紫绶金章/凤冠霞帔)
2. 女性服饰(裙装/头面首饰/整体妆扮)
3. 文士服饰(寒儒/隐逸/布衣与显达)
4. 武将戎装(战袍铠甲/民族武服/军旅仪仗)
5. 赐衣与赠衣(绨袍/割袍/御赐衣冠)
6. 日常与平民服饰
步骤5:文件输出
| 文件 | 大小控制 | 内容 |
|---|---|---|
| 全元曲杂剧_总结.md | ≤20KB | 分类综述+关键原文引用+学术审查+总结表 |
| 全元曲杂剧_原文提取.md | ≤20KB | 带行号原始片段+分类分组+关键词加粗 |
| 全元曲杂剧_日志.md | ≤20KB | 完整操作记录 |
过滤规则说明
- 非服饰义过滤:如"地带""带领""局势""柳絮"等非服饰义用法已排除
- 重复过滤:同一服饰描写在不同折中重复出现时,仅保留最完整版本
- 修辞过滤:纯粹比喻用法(如"锦心绣口")不纳入,但"锦衣""绣鞋"等实指保留
- 代表性选取:同类描写(如多处"紫袍")选取最有细节者,不穷举
难点与备注
- "带"字命中率最高(1279),但大量为动词/地名用法,需逐一甄别
- "衣冠"复合词兼具服饰义和身份义(如"衣冠之士"),按语境判定
- 元杂剧特殊用语:如"虎磕脑"(虎形头盔装饰)、"夜叉裙"(丑角裙)等特有名词需保留
- 民族服饰:元代杂剧中番汉服饰交融(貂裘/鹔鸘裘/暖帽)反映时代特色
- 靴笏襕袍为元代状元标准装束,文献价值高