《玉娇梨》服饰提取日志
基本信息
- 输入文件:/home/z/my-project/upload/part3/玉娇梨.txt
- 文件大小:398,042字节,1,075行
- 输出目录:/home/z/my-project/upload/3小说output/玉娇梨/
6轮grep搜索记录
第1轮:基础服饰词(衣、裳、袍、衫、裙)
- 关键词:
衣|裳|袍|衫|裙
- 命中行数:约45行
- 有效服饰条目:约30条
- 主要发现:更衣、便衣、官服、青衣、白袍、紫衣、色衣、蓝衫、春衫、绣裙、石榴裙、绡衣
- 去除误命中:画锦衣(诗意比喻)、锦衣(比喻)、衣不解带(成语非服饰)
第2轮:配饰词(冠、帽、巾、簪、钗、环、佩)
- 关键词:
冠|帽|巾|簪|钗|环|佩
- 命中行数:约35行
- 有效服饰条目:约20条
- 主要发现:挂冠、冠带、方巾、乌纱帽、片巾、大帽、毡帽、弱冠、头巾、葛巾、簪花、金钗
- 去除误命中:鸡冠紫(花名)、美如冠玉(成语比喻)、弱冠之年(年龄代称)、冠首(词头非帽子)
第3轮:面料色彩词(绫、罗、绸、缎、锦、绣)
- 关键词:
绫|罗|绸|缎|锦|绣
- 命中行数:约40行
- 有效服饰条目:约15条
- 主要发现:绫罗、绿罗裙、红绡、绸缎、重白绫子、绣裙、刺绣、绣针、锦囊
- 去除误命中:锦添锦(比喻)、锦绣文心/锦绣肠(文学比喻)、锦笺/锦屏/花笺(文具非服饰)、锦心(比喻)
第4轮:鞋履腰带词(鞋、履、靴、带、绦)
- 关键词:
鞋|履|靴|带|绦
- 命中行数:约25行
- 有效服饰条目:约8条
- 主要发现:绑腿鞋、草履、朝靴、冠带、衣不解带、腰里搭包
- 去除误命中:带在腰里(动作非服饰品类)、地带/携带(动词)
第5轮:妆容首饰词(妆、脂、粉、珠、翠)
- 关键词:
妆|脂|粉|珠|翠
- 命中行数:约35行
- 有效服饰条目:约18条
- 主要发现:新妆、改妆、男妆、脂粉、膏沐为容、满头珠翠、金镯、明珠、金钗、翠蛾、鸾镜
- 去除误命中:珠玉在前/珠玑(文学比喻)、珠觉(副词)、鱼目混珠(成语)、泪珠(非首饰)、涂名饰行(非妆容)
第6轮:综合补充词(装、束、戴、披、裹、饰)
- 关键词:
装|束|戴|披|裹|饰
- 命中行数:约25行
- 有效服饰条目:约12条
- 主要发现:头戴方巾、戴片巾、戴毡帽、金装玉裹、男装、古装、吉服、打扮、簪花挂红
- 去除误命中:装病/装醉/装腔(行为伪装非服饰)、装饰人耳目(比喻)、结束做两担(打包非穿戴)
汇总统计
- 6轮grep总命中行:约205行
- 去重后有效服饰相关行:约55行
- 去除误命中(比喻、成语、非服饰义项):约150行
- 最终提取原文条目:55条
过滤审查说明
- 大量"锦""绣"命中实为文学比喻(锦绣文心、锦心绣口),非服饰面料,已剔除。
- "衣"字大量命中为成语或非服饰义项(衣不解带、衣冠=人物代称),仅保留有服饰描写实义者。
- "珠"字大量命中为文学比喻(珠玉、珠玑、鱼目混珠),仅保留首饰义项(珠翠、明珠、金钗)。
- "装"字大量命中为"装病/装醉/装腔"等行为伪装,仅保留服饰义项(男装、古装、金装玉裹、打扮)。
- "冠"字中"弱冠之年""美如冠玉"为年龄/容貌比喻,非实物冠帽,已标注区分。
产出文件
- 玉娇梨_总结.md — 服饰内容分析总结
- 玉娇梨_日志.md — 本文件,提取过程日志
- 玉娇梨_原文提取.md — 按类别整理的原文服饰条目