《红楼春梦》服饰提取日志

提取任务信息

提取方法

6轮关键词grep搜索 + sed提取 + 人工过滤审查

各轮搜索详情

第1轮:基础服饰关键词(衣、裳、裙、袍、衫)

第2轮:配饰关键词(簪、钗、环、珮、带、帕、巾、抹胸、兜)

第3轮:面料与颜色关键词(绸、缎、绢、纱、绫、锦、罗、呢)

第4轮:鞋帽头饰关键词(鞋、靴、帽、冠、髻、发)

第5轮:妆容首饰关键词(脂、粉、珠、玉、翠、金、银)

第6轮:特殊服饰词(蟒、朝服、披风、斗篷、霞帔、鹤氅、补服、箭袖、马褂、龙袍)

过滤与审查

过滤原则

  1. 剔除纯比喻用法(如"衣租食税""金枝玉叶"等成语)
  2. 剔除建筑/器物用词(如"金铺玉砌"等非服饰描写)
  3. 剔除泛称无细节的提及(如单纯"换衣服""加衣服"无具体描述者)
  4. 保留有具体服饰名称、材质、颜色、形制的描写

审查结论

统计