《雷峰塔》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 雷峰塔 |
| 输入路径 | /home/z/my-project/upload/剧曲/剧曲/雷峰塔.txt |
| 输出路径 | /home/z/my-project/upload/剧曲output/雷峰塔/ |
| 总行数 | 1197 |
| 提取时间 | 2026-03-04 |
关键词命中统计
| 关键词 | 命中行数 | 有效/噪音 |
|---|---|---|
| 巾 | 17 | 有效约12行(八宝明珠巾/宝巾/包头绢/汗巾),"巾"字虚词5行 |
| 锦 | 14 | 有效约4行(锦绣/锦拖),"锦"字嵌于曲牌/人名10行 |
| 衣 | 16 | 有效约6行(绛绡衣/青衣/绣衣郎/衣巾/皮毛衣),"衣"字动词10行 |
| 丝 | 15 | 有效约5行(红丝/情丝/丝线),"丝"字嵌入曲牌10行 |
| 带 | 15 | 有效约3行(冠带/穿戴),"地带/带领/带来"等动词12行 |
| 罗 | 15 | 有效约3行(宫罗/罗袖/罗帐),"罗网/罗浮/那罗延"等非织物12行 |
| 绣 | 8 | 有效约5行(绣巾/绣鞋/绣衣郎/如绣),曲牌名3行 |
| 环 | 8 | 有效约2行(环佩/连环),"环"字非服饰6行 |
| 裘 | 8 | 全部为"裘王府"地名,非服饰,全部为噪音 |
| 帐 | 6 | 有效约2行(罗帐),"帐"字非帷帐4行 |
| 布 | 4 | 有效0行,全为"宣布/分布"等动词 |
| 麻 | 2 | 有效0行,"山麻"为曲牌名 |
| 绢 | 1 | 有效1行(包头绢) |
| 绫 | 0 | 无命中 |
| 绸 | 2 | 有效1行(绸缪),"绸"字1行 |
| 绡 | 2 | 有效2行(鲛绡/绛绡) |
| 绶 | 1 | 有效0行(非服饰语境) |
| 袍 | 1 | 有效1行(皂罗袍,曲牌名但含服饰信息) |
| 裙 | 3 | 有效3行(湘裙) |
| 簪 | 2 | 有效2行 |
| 冠 | 2 | 有效2行(冠带/五花官诰冠) |
| 绅 | 2 | 有效0行("李绅"人名) |
| 练 | 1 | 有效0行("修炼"非练帛) |
| 絮 | 2 | 有效1行(絮语),"棉絮"1行 |
| 旗 | 1 | 有效1行(捷旌旗) |
| 旌 | 2 | 有效2行(旌展/捷旌旗) |
| 裘/褐/履/屦/弁/冕/珥/绮/帛/纨/绂/黼/黻/鹖/帻/帷/幄/旆/纛 | 0 | 无命中 |
噪音过滤规则
- "裘"字:本书中"裘王府"为地名,出现8次,全部为噪音,非"裘皮"服饰
- "罗"字:"罗网/罗浮/那罗延"等非织物用法约12处,需人工鉴别
- "环"字:"连环/环中"等非首饰用法6处
- "带"字:动词"带领/带来/地带"等12处,仅"冠带""穿戴"为服饰
- "锦"字:曲牌名(锦衣香等)约10处,非实际织物
- "绅"字:"李绅"为人名(唐诗人),2处均为噪音
- "布"字:全部为动词"宣布/分布",0处有效
多轮grep验证
第一轮:全关键词扫描
rg -n '衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛' 雷峰塔.txt
命中约136行
第二轮:精细服饰名词
rg -n '衣裳|衫|袄|抹胸|膝裤|汗巾|披风|头巾|网巾|唐巾|毡巾|草帽|乌纱|凉鞋|蒲鞋|纱窗|纱帐|锦帐|罗帐|红罗|白绫|青缎|绵绸|缎子|绢裙|裙带|裙腰|布裙|绣鸳鸯|金簪|玉簪|珠翠|银绞丝|百脚旗|红缎|蓝衫|包巾|束发|扎额|头绳|天鹅绒|包头|押鬓|螳螂|蝴蝶|凤凰|靴头|脚带' 雷峰塔.txt
命中约12行
第三轮:装扮/梳妆关键词
rg -n '穿戴|梳头|包头|卸却|画眉|云鬟|堕马|金钏|芙蓉|粉黛|簪缨|团扇|宫罗|新妆|包头绢|犀梳|香丝|双螺|黄金钏|绛绡|鲛绡|红丝|鸳帏|凤髻|皮毛|绣鞋|罗袖|青衣' 雷峰塔.txt
命中约35行,为高精度服饰内容
输出文件大小检查
- 01_总结.md:约4KB ✓
- 02_原文提取.md:约6KB ✓
- 03_日志.md:约4KB ✓
- 均未超过20KB限制
特殊发现
- 行999为全书最精细的梳妆段落,从卸包头绢→犀梳→堕马鬟→画双螺→黄金钏→弹粉,完整再现清代女子晨妆流程
- 八宝明珠巾是全剧核心服饰道具,推动第二重大转折(盗库银→宝巾案→发配镇江),作为"冤物"串联多场戏
- 本书为传奇剧本,大量服饰词汇嵌于曲牌名中(如"皂罗袍""绣衣郎""红绣鞋"等),需区分曲牌名与实际服饰描写
- "裘王府"作为地名出现8次,全部为噪音,是本书最大的噪音源