《全元散曲》服饰提取操作日志

基本信息

  • 书名:全元散曲
  • 输入文件:/home/z/my-project/upload/剧曲/剧曲/全元散曲.txt
  • 输出目录:/home/z/my-project/upload/剧曲output/全元散曲/
  • 总行数:11566行
  • 处理日期:2026-03-04

操作步骤记录

步骤1:文件统计与目录创建

  • wc -l 统计总行数:11566行
  • mkdir -p 创建输出目录

步骤2:关键词命中统计(分批grep)

批次1(衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环)

关键词 命中行数
349
50
86
295
83
35
5
50
35
6
4
13
11
79
153
30
0
7
134
2
48
103

批次2(绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛)

关键词 命中行数
77
461
213
2
9
662
410
34
127
121
95
252
36
0
0
9
25
83
8
0
2
2
0
3
5
181
7
95
23
9
9

步骤3:逐类提取服饰描写段落

执行以下grep命令提取实质服饰内容:

  1. rg -n "衣冠|衣裳|布衣|锦衣|罗衣|绯衣|紫衣|白衣|青衣|黄衣|衣裉|衣袂|衣带|脱衣|更衣|换衣|裁衣|征衣|朝衣" → 50+行
  2. rg -n "罗袍|紫袍|龙袍|朝袍|布袍|麻袍|锦袍|纱袍|衣袍" → 30+行
  3. rg -n "簪花|簪冠|玉簪|金簪|银簪|翠簪|宝簪|琼簪" → 40+行
  4. rg -n "绛绡裙|罗裙|翠裙|红裙|湘裙|唐裙|裙纱|裙儿|裙掩" → 30+行
  5. rg -n "帷|帐|幄|旗|旌|旆|纛" → 40+行
  6. rg -n "冠|弁|冕|帻" (过滤"冠军|冠世|冠绝")→ 40+行
  7. rg -n "貂裘|裘|轻裘|敝裘" → 20+行
  8. rg -n "绶|绂|黼|黻|珥|鹖|帻" → 15+行
  9. rg -n "纨|绡|绫|缯|绢|帛" → 20+行
  10. rg -n "绿蓑衣|蓑衣|草衣|鹤氅|羽衣|六铢衣" → 25+行
  11. rg -n "翠袖|红袖|彩袖|舞袖|衫袖|窄袖|宽袖|长袖|短袖|袖手|两袖" → 30+行
  12. rg -n "金莲|凌波袜|绣鞋|弓鞋|罗鞋|红罗鞋|鞋儿|凤头鞋" → 20+行
  13. rg -n "金鱼玉带|紫绶金章|玉带|金带|银带|犀带|革带|束带" → 20+行
  14. rg -n "直裰|短褐|褐衣|褐夫|道袍|僧衣|法衣|衲衣" → 10+行
  15. rg -n "藕丝裳|缃裙|红锦帔|花布直裰|皂头巾|草衣木食|粗布裘|白苎|白纻" → 12+行
  16. rg -n "佩玉|环佩|鸣珰|金环|玉环|银环|佩环|解佩|遗佩" → 20+行
  17. rg -n "皂|缟|素衣|白衣|青衫|乌纱|皂巾|角巾|纶巾|华阳巾|逍遥巾" → 20+行
  18. rg -n "绣帏|绣帘|绣幕|绣帐|绣被|绣衾|绣枕|绣带|绣鞋|绣鞍|绣芙蓉" → 25+行
  19. rg -n "锦帐|锦被|锦衾|锦袍|锦衣|锦带|锦屏|锦阵|锦笺|锦书|锦字|锦堂" → 25+行
  20. rg -n "黄袍|柘黄|衮龙|龙衣|衮衣|蟒袍|绯衣|紫袍" → 10+行

步骤4:过滤与精选

过滤原则
- 排除纯修辞用法(如"锦绣河山""锦上添花"等成语化表达)
- 排除作者小传中的非曲文引用(如L2084曾瑞传记中的"衣冠整肃"等)
- 排除重复出现同一意象的次要用例(如"罗衣宽"模式仅保留2-3个代表)
- 保留有具体服饰形制、材质、色彩描写的段落
- 保留有服饰穿戴动作描写的段落
- 保留反映社会阶层、性别差异的服饰对比段落

精选结果
- 官服朝仪类:17条
- 官服与隐服对举:13条
- 女子裙装:16条
- 女子上衣与袖:18条
- 女子足饰:7条
- 首饰佩饰:12条
- 隐士服饰:15条
- 裘服:9条
- 帷帐帘幕:6条
- 特殊服饰:8条
- 合计约121条代表性片段

步骤5:输出文件生成

  1. 全元散曲_总结.md:分类综述+关键词统计+学术审查+总结表
  2. 全元散曲_原文提取.md:带行号原始片段,分类分组,关键词加粗
  3. 全元散曲_日志.md:本文件,完整操作记录

数据质量说明

  1. 本文件11566行,体量较大,采用分批grep而非全文加载方式处理
  2. 高频词(锦662、罗461、绣410)存在大量非服饰义用法,已人工甄别过滤
  3. "衣冠"一词既可指实际穿着,也可指官员阶层("衣冠济楚"),分类时已加注释
  4. 散曲体制决定服饰描写多为意象化点染,少见具体形制描写,与戏曲剧本不同
  5. 元代散曲反映的服饰信息以汉族传统为主,蒙古服饰元素极罕见
  6. "白苎"在散曲中既指白苎衫,也指《白苎歌》曲调名,需区分

关键发现

  1. 官服—隐服对举为元散曲最突出的服饰母题,反映元代文人仕隐矛盾
  2. 罗衣宽褪为闺情曲固定修辞,"宽"字直指相思消瘦
  3. 弓鞋金莲反映元代缠足已普遍,散曲中有具体尺寸描写("半折""多三指")
  4. 簪为信物:玉簪折断=分离,为散曲核心意象
  5. 布袍蓑衣构成隐士标准装扮,与紫罗袍形成价值对立
  6. 白苎为南方特有服饰材质,散曲中常与歌咏关联