六十种曲昙花记 服饰内容提取日志

基本信息

  • 书名:六十种曲昙花记
  • 输入文件:/home/z/my-project/upload/剧曲/剧曲/六十种曲昙花记.txt
  • 输出目录:/home/z/my-project/upload/剧曲output/六十种曲昙花记/
  • 总行数:2029行

提取流程

第一步:wc -l 查总行数

  • 结果:2029行

第二步:grep -n 提取服饰关键词行号

使用词库全量关键词(50字)执行 rg -n 匹配,共命中284行。

各关键词命中行数统计:

关键词 命中数 关键词 命中数 关键词 命中数
78 2 21
52 12 1
1 5 15
0 1 5
1 4 16
2 0 4
5 2 8
5 16 60
1 0 1
21 44 0
1 23 6
18 0 0
0 0 2
10 6 0
0 0 0
1 4 9
3 24 13
0 0

第三步:噪音过滤

  • "带"(52次):大量为动词用法("带将吏""带家奴""带随从"等),实际服饰义仅约12处(玉带、绣带、紫绶等)
  • "丝"(18次):多为隐喻用法("一丝不挂""柳丝""青丝网""藕断丝连"等),服饰义约3处("青丝髻""丝绵""丝罗")
  • "布"(23次):多为动词("分布""布野""布施""布令"),服饰义仅3处("布袍""蓝布袍""布裳")
  • "旗"(24次):多为军旗/旌旗,归入仪仗类服饰
  • "衣"(78次):约20处为非服饰义("衣珠""一衣带水"等比喻),服饰义约58处
  • "绣"(44次):部分为装饰义("绣户""绣柱""绣毯"),衣物相关约20处

第四步:有效服饰内容分类

经逐行审读,提取出有效服饰相关原文约80余条,按类别归入总结与原文提取文件。

第五步:输出三份MD

  • 六十种曲昙花记_总结.md(分类归纳)
  • 六十种曲昙花记_原文提取.md(原文引用)
  • 六十种曲昙花记_日志.md(本文件)

备注

  • 全书2029行,为明代屠隆所著传奇剧,共55出
  • 主题为定兴王木清泰弃官入道、云游修行,最终成道的故事
  • 服饰描写集中在三个场景转换:王侯富贵→出家修行→成道升仙
  • 本提取严格按词库关键词执行,未增删关键词