《清代燕都梨园史料正编》服饰提取日志

基本信息

  • 书名:清代燕都梨园史料正编
  • 输入文件:/home/z/my-project/upload/剧曲/剧曲/清代燕都梨园史料正编.txt
  • 输出目录:/home/z/my-project/upload/剧曲output/清代燕都梨园史料正编/
  • 总行数:13356行
  • 处理日期:2026-03-05

关键词检索记录

第一轮:核心服饰词

关键词 命中行数(约) 有效服饰行
100+ 约40行
30+ 约15行
80+ 约20行
80+ 约15行
50+ 约25行

第二轮:身体服饰词

关键词 命中行数(约) 有效服饰行
20+ 约8行
15+ 约5行
5+ 约2行
5+ 约1行
10+ 约5行
10+ 约5行
10+ 约5行
20+ 约10行

第三轮:首饰佩饰词

关键词 命中行数(约) 有效服饰行
10+ 约2行
15+ 约5行
15+ 约3行
极少 0行

第四轮:织物材料词

关键词 命中行数(约) 有效服饰行
15+ 约5行
30+ 约15行
10+ 约3行
30+ 约15行
30+ 约15行
5+ 约2行
5+ 约2行
5+ 约2行
10+ 约5行
5+ 约2行
5+ 约1行
5+ 约1行
50+ 约10行("丝"多指弦乐器)

第五轮:旗帜帷帐词

关键词 命中行数(约) 有效服饰行
30+ 约3行(多指"旗亭"酒楼)
5+ 约1行
10+ 约3行
15+ 约5行
极少 0行
极少 0行

第六轮:其他词

关键词 命中行数(约) 有效服饰行
5+ 约2行
10+ 约3行
极少 0行
黼/黻 极少 0行
极少 0行
10+ 约2行
5+ 约1行
5+ 约2行
5+ 约1行
10+ 约1行

噪音过滤说明

已过滤的噪音类型

  1. "丝"指弦乐器:如"丝竹""丝弦""丝桐"等,非服饰用丝,已排除
  2. "旗亭"为酒楼名:大量"旗亭"为唐代酒楼典故,非旗帜服饰
  3. "衣冠"作代称:如"衣冠荟萃之地""冠裳会集",为士大夫阶层代称,非具体服饰描写
  4. "衣钵"作传承义:如"传其衣钵",为佛家传承比喻,已排除
  5. "裳楚楚"等修辞:如"裳楚楚而叹蜉蝣",为文学修辞而非服饰写实
  6. "霓裳"作典故:大量"霓裳"为唐玄宗霓裳羽衣曲典故,非写实戏装
  7. "衣香"等感官描写:如"灯影衣香""水碧衣香",为氛围描写,非服饰
  8. 遗山集句:书中大段引元好问诗句,多与梨园无关,已排除
  9. 剧目名含服饰词:如《斩黄袍》《打龙袍》为剧目名,本身非服饰描写,但相关评述中涉及袍带戏分类则保留

保留的边界情况

  1. "五铢衣":虽为仙家衣典故,但在戏评中实指戏装轻盈效果,保留
  2. "衣冠优孟":虽为典故,但直接关联戏曲扮相传统,保留
  3. "草上霜"裘名:虽为皮货商术语,但反映伶人裘服消费,保留
  4. "白练裙":虽为文学典故,但关联伶人赠诗传统,保留

文件大小控制

  • 总结.md:约8KB ✓(≤20KB)
  • 原文提取.md:约12KB ✓(≤20KB)
  • 日志.md:约6KB ✓(≤20KB)
  • 总计约26KB ✓(≤1M)

质量自检

  • [x] 引用原文不转述
  • [x] grep验证关键词覆盖率
  • [x] 不加载整本TXT(使用sed -n按行提取)
  • [x] 每篇≤20KB
  • [x] 不凑字不灌水
  • [x] 区分戏装与常服
  • [x] 标注出处行号可回查