《画图缘》服饰提取日志

提取时间:2026-03-04
输入文件:/home/z/my-project/upload/part3/画图缘.txt(311,663字节,693行)
输出目录:/home/z/my-project/upload/3小说output/画图缘/


一、提取流程

第1轮grep:基本衣类词

关键词:衣、裳、袍、衫、裙、裤
命中行数:约25行
有效提取: - 衣冠楚楚(行131) - 身穿美服/色服(行170、173) - 长衣脱去束腰带(行183) - 蓝衫扯破(行183) - 衣巾革褫(行199、202) - 旧布衣(行284) - 大衣脱了(行298) - 儒巾蓝衫(行400) - 吉服(行400) - 书生的儒衣(行500) - 衣冠中人物(行511) - 大红吉服(行663) - 薄裙钗(行556)

过滤:排除"衣食"(行35等,指生计)、"衣巾"作"衣冠"泛称但非服饰描写者保留。

第2轮grep:冠帽首饰词

关键词:冠、帽、巾、簪、钗、环、珮、佩
命中行数:约30行
有效提取: - 儒巾(行170、173) - 头巾粉碎(行183) - 片玉巾(行341) - 破帽子(行284) - 乌纱帽(行659) - 峨冠博带(行659) - 碧玉连环(行389、390、603等) - 红丝(行55)

过滤:排除"冠玉"(行50,比喻容貌)、"环"作"环绕"义者。

第3轮grep:布帛织料词

关键词:绫、罗、绸、缎、锦、绣、纱、绢、缯、帛
命中行数:约15行
有效提取: - 纱罗(行341) - 锦绣罗绮(行396、627) - 红锦(行400) - 红绫(行616) - 纱窗(行314,排除——非服饰)

过滤:排除"绣阁"(泛指闺房)、"锦绣"作形容词非指实物者。

第4轮grep:珠宝金银词

关键词:玉、珠、翠、金、银、珰、钏、镯、钿
命中行数:约50行(大量"金"字作金钱/金瓯义)
有效提取: - 碧玉连环(已收录) - 玉指尖(行258) - 金装玉服(行624) - 翠贴眉梢(行258)

过滤:排除"金瓯"(行33/36,国家喻)、"金钱"(行35,军费)、"金银"(行121,劫掠财物)、"玉蕴辉山"(行92,比喻)等非服饰用法。

第5轮grep:鞋履带袜词

关键词:襦、袄、褐、裘、带、履、靴、屐、屦、袜、鞋
命中行数:约12行
有效提取: - 腰带(行183) - 鞋袜(行341) - 峨冠博带(已收录) - 缁衣(行574)

过滤:排除"地带"(地理)、"履"作"履历/践行"义者。

第6轮grep:妆扮颜色词

关键词:妆、脂、粉、髻、鬟、黛、钿、红、紫、青、蓝
命中行数:约40行("红""青"出现频率极高)
有效提取: - 脂粉(行298、419) - 高鬓云环、翠眉蝉鬓(行531) - 大红员领(行659) - 大红吉服(行663) - 蓝衫(行183,已收录) - 红巾(行624) - 小姐的衣饰(行500)

过滤:大量排除"红"作"红尘/红毡/红丝"等非衣饰义、"青"作"青年/青羊岭"等、"蓝玉"为人名。


二、审查与取舍

保留标准

  1. 直接描写人物穿着的实物服饰
  2. 与服饰相关的礼仪用品(聘物、催妆物)
  3. 服饰作为身份/地位标识的语境

排除标准

  1. 比喻用法(美如冠玉、玉蕴辉山)
  2. 泛指非实物(锦绣作形容词)
  3. 金钱/财物语境(金银、金瓯)
  4. 地名/人名中的颜色词(青羊岭、蓝玉)
  5. 建筑陈设(纱窗、红毡铺地)

最终收录

经6轮搜索+过滤,共收录38条服饰相关原文,分为5类: - 衣冠服饰:19条 - 布帛织料:8条 - 冠帽鞋袜:3条 - 首饰佩物:4条 - 妆扮相关:5条(含1条重复分类)


三、数据统计

指标 数值
原文总行数 693
原文总字节 311,663
grep搜索轮次 6
grep总命中行数 约172行(含大量非服饰义)
过滤后有效行数 约38条
服饰描写密度 约1条/18行(低密度)

四、注意事项

  1. 本书为清初作品,服饰制度以明代为底本(儒巾蓝衫、乌纱帽等),部分描写有清代痕迹。
  2. "碧玉连环"虽属首饰,但其在书中功能为聘礼信物,兼具服饰与礼仪双重属性。
  3. 女性角色(蓝玉小姐、赵红瑞)的服饰几乎无日常描写,仅在婚礼场景有盛装提及,反映才子佳人小说"重才轻貌"的倾向。
  4. "片玉巾"为作者自造词,未见于明代服饰制度,或为小说家虚构。

日志完毕。