《笏山记》服饰提取日志
基本信息
- 源文件:/home/z/my-project/upload/part3/笏山记.txt
- 文件大小:737,161 字节(约737KB)
- 总行数:486行(含超长行)
- 输出目录:/home/z/my-project/upload/3小说output/笏山记/
- 处理时间:2026年3月4日
六轮Grep搜索记录
第1轮:基础服饰词(衣袍衫裙褂裘袄褛褐)
- 关键词:衣、袍、衫、裙、褂、裘、袄、褛、褐、襦、袂、裾、襟
- 命中数:249处
- 过滤后有效:约45处(排除"锦溪"等地名、"衣冠言语"等泛指、"衣带间"等非描写性用词)
第2轮:首服冠帽(冠帽巾帻簪钗钿)
- 关键词:冠、帽、巾、帻、簪、钗、钿、步摇、凤冠、花钿
- 命中数:104处
- 过滤后有效:约30处(排除"弱冠"、"头巾书生"等泛指、"锦衣使"等官名)
第3轮:足服带饰(鞋履靴带绦袜)
- 关键词:鞋、履、靴、带、绦、袜、丝带、玉带、金带、革带
- 命中数:288处
- 过滤后有效:约15处(大量"带着""带领"等动词干扰,需严格过滤)
第4轮:珠宝佩饰(珠环佩珮璧璎珞钏镯)
- 关键词:珠、环、佩、珮、璧、璎珞、钏、镯、金钗、银钗、玉佩、珠翠
- 命中数:204处
- 过滤后有效:约25处(排除"环拱""连珠炮""贯珠"等人名/地名)
第5轮:织绣面料(绣锦绮罗绸缎纱绢绫)
- 关键词:绣、锦、绮、罗、绸、缎、纱、绢、绫、绒、缂丝、织金、妆花
- 命中数:251处
- 过滤后有效:约40处(大量"锦绣""锦囊"等比喻性用词需排除)
第6轮:官服礼服朝服(朝服蟒衣赐服章服等)
- 关键词:朝服、蟒袍、赐服、章服、官服、吉服、公服、常服、祭服、礼服、道袍、僧衣、法衣、盔甲、甲胄、铠甲、战袍、武服、儒服、儒巾、方巾、乌纱、纱帽
- 命中数:12处
- 过滤后有效:12处(精准度最高)
汇总统计
| 轮次 |
命中数 |
有效数 |
有效率 |
| 第1轮 |
249 |
~45 |
18% |
| 第2轮 |
104 |
~30 |
29% |
| 第3轮 |
288 |
~15 |
5% |
| 第4轮 |
204 |
~25 |
12% |
| 第5轮 |
251 |
~40 |
16% |
| 第6轮 |
12 |
12 |
100% |
| 合计 |
1108 |
~167 |
15% |
过滤规则
- 排除地名:锦溪、绣旗乡、玉带泉、白衣庙等
- 排除官名:锦衣使、锦衣军、绣旗伯、玉带侯等
- 排除泛指:衣冠言语、衣带间、头巾书生等非描写性用词
- 排除人名:贯珠(人名)、连珠(人名组成部分)等
- 排除比喻:锦绣山河、锦囊妙计等修辞用法
- 保留标准:必须有具体的服饰形态描写(颜色、材质、款式、穿戴方式等)
分类结果
| 类别 |
提取数 |
| 战甲军服 |
26处 |
| 冠帽首服 |
22处 |
| 衣袍裙衫 |
28处 |
| 珠宝配饰 |
10处 |
| 鞋履足服 |
10处 |
| 妆扮更衣 |
10处 |
| 总计 |
106处 |
审查发现
- 重复段落:第18-19回足足与病尼姑争夺罗襦/绣鞋场景跨回出现,同一描写计为多处
- 官名与服饰重叠:"锦衣"一词既是官名(锦衣使、锦衣军)又是服饰描写(锦衣少年),需逐一辨别
- 战裙定义:本书"战裙"为女将标配,非裙装而是甲胄组成部分,与绣裙(礼服)不同
- 回目中的服饰:回目如"白衣中状元""玉佩韩公子"仅作索引标记,不计入实质描写
- 缺失内容:第6回后部分、第40-55回间服饰描写相对稀少,与叙事重心转移有关
数据质量评估
- 信度:高。所有提取均基于原文逐字匹配,无臆造内容
- 效度:中高。过滤规则排除了85%的非服饰命中,保留项均为实质服饰描写
- 覆盖度:中。6轮关键词覆盖了主要服饰类型,但可能遗漏少量未用常见词汇描述的服饰场景