《山歌》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 山歌 |
| 输入路径 | /home/z/my-project/upload/剧曲/剧曲/山歌.txt |
| 输出路径 | /home/z/my-project/upload/剧曲output/山歌/ |
| 总行数 | 748 |
| 提取时间 | 2026-03-04 |
关键词命中统计
| 关键词 | 命中行数 | 有效/噪音 |
|---|---|---|
| 罗 | 44 | 大量虚词"罗里/罗道/罗怕/罗知",有效约6行(罗帐/罗裙/紫罗裙/红罗帐/绫罗/白罗帕) |
| 丝 | 15 | 有效约8行(绫罗/丝网/千丝/银绞丝/细丝/生丝线/丝线),部分为"簌/嘶"等通假 |
| 帐 | 16 | 有效约10行(罗帐/锦帐/红罗帐/红纱帐/合欢帐/拆帐) |
| 裙 | 17 | 有效约15行 |
| 布 | 12 | 有效约8行(布裙/布衫/抹布/布头布脑),"宣布/发布"等噪音4行 |
| 带 | 12 | 有效约5行(裙带/头带/脚带/带月披星),"地带/带来"等噪音7行 |
| 衣 | 10 | 有效约8行(衣裳/脱衣/穿衣/衣身),"依/意义"等噪音2行 |
| 纱 | 9 | 有效约7行(纱窗/纱衫/红纱帐),"纺纱"语境2行 |
| 麻 | 9 | 有效约6行(麻绳/满身麻/麻布),"麻子"人名3行 |
| 绫 | 6 | 有效6行 |
| 锦 | 5 | 有效5行 |
| 绣 | 5 | 有效4行(绣鸳鸯/绣球),"锈"通假1行 |
| 裳 | 5 | 有效5行 |
| 簪 | 4 | 有效4行 |
| 绢 | 4 | 有效4行 |
| 绸 | 3 | 有效3行 |
| 旗 | 3 | 有效1行(百脚旗),"旗号"等2行 |
| 冠 | 1 | 有效1行(乌纱冠) |
| 绅 | 1 | 有效1行(荐绅) |
| 襟 | 1 | 有效1行(襟袖) |
| 幅 | 2 | 有效2行 |
| 环 | 2 | 有效2行 |
| 缎 | 2 | 有效2行 |
| 缯 | 2 | 有效2行 |
| 絮 | 1 | 有效1行 |
| 帛/纨/绡/绶/绂/黼/黻/鹖/帻/帷/幄/旌/旆/纛 | 0 | 无命中 |
噪音过滤规则
- "罗"字虚词:吴语"罗里=哪里""罗道=哪道""罗怕=哪怕""罗知=哪知""罗亨=哪能"等,均非织物"罗",用
rg -v '罗里|罗道|罗怕|罗知|罗管|罗匡|罗敢|罗许|罗亨|罗哩|罗得|罗见|罗个'过滤 - "带"字动词:"带来/带累/带月/带着"等非服饰用词,人工筛选
- "布"字非织物:"宣布/发布/分布/铺布"等,排除
- "旗"字非旗帜:"旗号/旗杆"等语境中非旗帜实体
多轮grep验证
第一轮:全关键词扫描
rg -n '衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛' 山歌.txt
命中125行
第二轮:过滤"罗"字噪音
rg -v '罗里|罗道|罗怕|罗知|罗管|罗匡|罗敢|罗许|罗亨|罗哩|罗得|罗见|罗个'
剩余约95行
第三轮:精细化提取服饰专有名词
rg -n '衣裳|衫|袄|抹胸|膝裤|汗巾|披风|头巾|网巾|唐巾|毡巾|草帽|乌纱|凉鞋|蒲鞋|纱窗|纱帐|锦帐|罗帐|红罗|白绫|青缎|绵绸|缎子|绢裙|裙带|裙腰|布裙|绣鸳鸯|金簪|玉簪|珠翠|银绞丝|百脚旗|红缎|蓝衫|包巾|束发|扎额|头绳|天鹅绒|包头|押鬓|螳螂|蝴蝶|凤凰|靴头|脚带' 山歌.txt
命中约65行,为高精度服饰内容
输出文件大小检查
- 01_总结.md:约5KB ✓
- 02_原文提取.md:约8KB ✓
- 03_日志.md:约4KB ✓
- 均未超过20KB限制
特殊发现
- 行688为全书服饰最密集段落(约300字长段),完整描述烧香女子借衣借首饰的全过程,是研究明末吴地女子服饰体系的珍贵材料
- 行690为帽子专题长段,记录了从尖顶帽到平顶鼓墩的帽子演变,以及帽子拆改再利用的民间习俗
- 行667以"汤婆子"与"竹夫人"拟人对话,涉及"绿袄红裙""衣身"等服饰描写,是少见的器物拟人服饰文学
- 本书为吴语文献,大量服饰用语带有方言特色(如"绫褡""绸段")