《画图缘》服饰提取日志
提取时间:2026-03-04
输入文件:/home/z/my-project/upload/part3/画图缘.txt(311,663字节,693行)
输出目录:/home/z/my-project/upload/3小说output/画图缘/
一、提取流程
第1轮grep:基本衣类词
关键词:衣、裳、袍、衫、裙、裤
命中行数:约25行
有效提取:
- 衣冠楚楚(行131)
- 身穿美服/色服(行170、173)
- 长衣脱去束腰带(行183)
- 蓝衫扯破(行183)
- 衣巾革褫(行199、202)
- 旧布衣(行284)
- 大衣脱了(行298)
- 儒巾蓝衫(行400)
- 吉服(行400)
- 书生的儒衣(行500)
- 衣冠中人物(行511)
- 大红吉服(行663)
- 薄裙钗(行556)
过滤:排除"衣食"(行35等,指生计)、"衣巾"作"衣冠"泛称但非服饰描写者保留。
第2轮grep:冠帽首饰词
关键词:冠、帽、巾、簪、钗、环、珮、佩
命中行数:约30行
有效提取:
- 儒巾(行170、173)
- 头巾粉碎(行183)
- 片玉巾(行341)
- 破帽子(行284)
- 乌纱帽(行659)
- 峨冠博带(行659)
- 碧玉连环(行389、390、603等)
- 红丝(行55)
过滤:排除"冠玉"(行50,比喻容貌)、"环"作"环绕"义者。
第3轮grep:布帛织料词
关键词:绫、罗、绸、缎、锦、绣、纱、绢、缯、帛
命中行数:约15行
有效提取:
- 纱罗(行341)
- 锦绣罗绮(行396、627)
- 红锦(行400)
- 红绫(行616)
- 纱窗(行314,排除——非服饰)
过滤:排除"绣阁"(泛指闺房)、"锦绣"作形容词非指实物者。
第4轮grep:珠宝金银词
关键词:玉、珠、翠、金、银、珰、钏、镯、钿
命中行数:约50行(大量"金"字作金钱/金瓯义)
有效提取:
- 碧玉连环(已收录)
- 玉指尖(行258)
- 金装玉服(行624)
- 翠贴眉梢(行258)
过滤:排除"金瓯"(行33/36,国家喻)、"金钱"(行35,军费)、"金银"(行121,劫掠财物)、"玉蕴辉山"(行92,比喻)等非服饰用法。
第5轮grep:鞋履带袜词
关键词:襦、袄、褐、裘、带、履、靴、屐、屦、袜、鞋
命中行数:约12行
有效提取:
- 腰带(行183)
- 鞋袜(行341)
- 峨冠博带(已收录)
- 缁衣(行574)
过滤:排除"地带"(地理)、"履"作"履历/践行"义者。
第6轮grep:妆扮颜色词
关键词:妆、脂、粉、髻、鬟、黛、钿、红、紫、青、蓝
命中行数:约40行("红""青"出现频率极高)
有效提取:
- 脂粉(行298、419)
- 高鬓云环、翠眉蝉鬓(行531)
- 大红员领(行659)
- 大红吉服(行663)
- 蓝衫(行183,已收录)
- 红巾(行624)
- 小姐的衣饰(行500)
过滤:大量排除"红"作"红尘/红毡/红丝"等非衣饰义、"青"作"青年/青羊岭"等、"蓝玉"为人名。
二、审查与取舍
保留标准
- 直接描写人物穿着的实物服饰
- 与服饰相关的礼仪用品(聘物、催妆物)
- 服饰作为身份/地位标识的语境
排除标准
- 比喻用法(美如冠玉、玉蕴辉山)
- 泛指非实物(锦绣作形容词)
- 金钱/财物语境(金银、金瓯)
- 地名/人名中的颜色词(青羊岭、蓝玉)
- 建筑陈设(纱窗、红毡铺地)
最终收录
经6轮搜索+过滤,共收录38条服饰相关原文,分为5类: - 衣冠服饰:19条 - 布帛织料:8条 - 冠帽鞋袜:3条 - 首饰佩物:4条 - 妆扮相关:5条(含1条重复分类)
三、数据统计
| 指标 | 数值 |
|---|---|
| 原文总行数 | 693 |
| 原文总字节 | 311,663 |
| grep搜索轮次 | 6 |
| grep总命中行数 | 约172行(含大量非服饰义) |
| 过滤后有效行数 | 约38条 |
| 服饰描写密度 | 约1条/18行(低密度) |
四、注意事项
- 本书为清初作品,服饰制度以明代为底本(儒巾蓝衫、乌纱帽等),部分描写有清代痕迹。
- "碧玉连环"虽属首饰,但其在书中功能为聘礼信物,兼具服饰与礼仪双重属性。
- 女性角色(蓝玉小姐、赵红瑞)的服饰几乎无日常描写,仅在婚礼场景有盛装提及,反映才子佳人小说"重才轻貌"的倾向。
- "片玉巾"为作者自造词,未见于明代服饰制度,或为小说家虚构。
日志完毕。