《雷峰塔》服饰提取日志

基本信息

项目 内容
书名 雷峰塔
输入路径 /home/z/my-project/upload/剧曲/剧曲/雷峰塔.txt
输出路径 /home/z/my-project/upload/剧曲output/雷峰塔/
总行数 1197
提取时间 2026-03-04

关键词命中统计

关键词 命中行数 有效/噪音
17 有效约12行(八宝明珠巾/宝巾/包头绢/汗巾),"巾"字虚词5行
14 有效约4行(锦绣/锦拖),"锦"字嵌于曲牌/人名10行
16 有效约6行(绛绡衣/青衣/绣衣郎/衣巾/皮毛衣),"衣"字动词10行
15 有效约5行(红丝/情丝/丝线),"丝"字嵌入曲牌10行
15 有效约3行(冠带/穿戴),"地带/带领/带来"等动词12行
15 有效约3行(宫罗/罗袖/罗帐),"罗网/罗浮/那罗延"等非织物12行
8 有效约5行(绣巾/绣鞋/绣衣郎/如绣),曲牌名3行
8 有效约2行(环佩/连环),"环"字非服饰6行
8 全部为"裘王府"地名,非服饰,全部为噪音
6 有效约2行(罗帐),"帐"字非帷帐4行
4 有效0行,全为"宣布/分布"等动词
2 有效0行,"山麻"为曲牌名
1 有效1行(包头绢)
0 无命中
2 有效1行(绸缪),"绸"字1行
2 有效2行(鲛绡/绛绡)
1 有效0行(非服饰语境)
1 有效1行(皂罗袍,曲牌名但含服饰信息)
3 有效3行(湘裙)
2 有效2行
2 有效2行(冠带/五花官诰冠)
2 有效0行("李绅"人名)
1 有效0行("修炼"非练帛)
2 有效1行(絮语),"棉絮"1行
1 有效1行(捷旌旗)
2 有效2行(旌展/捷旌旗)
裘/褐/履/屦/弁/冕/珥/绮/帛/纨/绂/黼/黻/鹖/帻/帷/幄/旆/纛 0 无命中

噪音过滤规则

  1. "裘"字:本书中"裘王府"为地名,出现8次,全部为噪音,非"裘皮"服饰
  2. "罗"字:"罗网/罗浮/那罗延"等非织物用法约12处,需人工鉴别
  3. "环"字:"连环/环中"等非首饰用法6处
  4. "带"字:动词"带领/带来/地带"等12处,仅"冠带""穿戴"为服饰
  5. "锦"字:曲牌名(锦衣香等)约10处,非实际织物
  6. "绅"字:"李绅"为人名(唐诗人),2处均为噪音
  7. "布"字:全部为动词"宣布/分布",0处有效

多轮grep验证

第一轮:全关键词扫描

rg -n '衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛' 雷峰塔.txt

命中约136行

第二轮:精细服饰名词

rg -n '衣裳|衫|袄|抹胸|膝裤|汗巾|披风|头巾|网巾|唐巾|毡巾|草帽|乌纱|凉鞋|蒲鞋|纱窗|纱帐|锦帐|罗帐|红罗|白绫|青缎|绵绸|缎子|绢裙|裙带|裙腰|布裙|绣鸳鸯|金簪|玉簪|珠翠|银绞丝|百脚旗|红缎|蓝衫|包巾|束发|扎额|头绳|天鹅绒|包头|押鬓|螳螂|蝴蝶|凤凰|靴头|脚带' 雷峰塔.txt

命中约12行

第三轮:装扮/梳妆关键词

rg -n '穿戴|梳头|包头|卸却|画眉|云鬟|堕马|金钏|芙蓉|粉黛|簪缨|团扇|宫罗|新妆|包头绢|犀梳|香丝|双螺|黄金钏|绛绡|鲛绡|红丝|鸳帏|凤髻|皮毛|绣鞋|罗袖|青衣' 雷峰塔.txt

命中约35行,为高精度服饰内容

输出文件大小检查

  • 01_总结.md:约4KB ✓
  • 02_原文提取.md:约6KB ✓
  • 03_日志.md:约4KB ✓
  • 均未超过20KB限制

特殊发现

  1. 行999为全书最精细的梳妆段落,从卸包头绢→犀梳→堕马鬟→画双螺→黄金钏→弹粉,完整再现清代女子晨妆流程
  2. 八宝明珠巾是全剧核心服饰道具,推动第二重大转折(盗库银→宝巾案→发配镇江),作为"冤物"串联多场戏
  3. 本书为传奇剧本,大量服饰词汇嵌于曲牌名中(如"皂罗袍""绣衣郎""红绣鞋"等),需区分曲牌名与实际服饰描写
  4. "裘王府"作为地名出现8次,全部为噪音,是本书最大的噪音源