《胡涂世界》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 胡涂世界 |
| 作者 | 清·吴趼人 |
| 版本 | 光绪三十二(1906)丙午年中秋,世界繁华报馆出版单行本 |
| 卷回 | 十二卷十二回 |
| 源文件 | /home/z/my-project/upload/part3/胡涂世界.txt |
| 文件行数 | 595行 |
| 文件大小 | 290,456字节 |
| 输出目录 | /home/z/my-project/upload/3小说output/胡涂世界/ |
提取流程
第1轮grep:基础服饰关键词(衣、裳、袍、衫)
搜索命令:rg -n '衣|裳|袍|衫'
命中行数:约25行,有效服饰相关约20行
有效发现: - 第55行:穿了衣帽来拜(官场日常穿着) - 第68行:换了件洋缎的衣裳(丁忧后换华服) - 第96行:穿的衣裳都是素的(丁忧素服) - 第99行:几件时新衣裳当银子 - 第118行:蟒袍(官服关键条目) - 第142行:改了素衣 - 第160行:穿的衣裳龌龊不堪 - 第277行:月白湖绉紧身棉袄、寿衣 - 第281行:棉袍子(画眉笼子段) - 第451行:衣服千万不可古董/华丽(官场穿衣术) - 第461行:蟒袍补褂
过滤掉:纯语气词"衣"的无实义搭配若干
第2轮grep:基础服饰关键词(裙、裤、帽、冠、履、鞋、靴)
搜索命令:rg -n '裙|裤|帽|冠|履|鞋|靴'
命中行数:约20行,有效约15行
有效发现: - 第77行:戴上帽子站班 - 第113行:鞋子扎铁搭、鞋口拉破 - 第118行:粉底皂靴(官靴) - 第145行:衣裳鞋袜拖一片挂一片 - 第149行:衣履 - 第191行:履声橐橐(脚步声,非服饰实义,过滤) - 第281行:靴子、外褂子、帽盒 - 第306行:做了袍套买了一副补子 - 第371行:红缨大帽 - 第404行:脱了小褂子装的、脱了裤子装的、脱了套裤装的 - 第414行:帽子探了下来 - 第461行:戴着水晶项子 - 第474行:戴红缨大帽子的 - 第570行:鞋子已是没有底了
过滤掉:第191行"履声橐橐"仅为脚步声描写
第3轮grep:配饰/织物关键词(带、佩、簪、钗、钏、环)
搜索命令:rg -n '带|佩|簪|钗|钏|环'
命中行数:大量("带""环"为常见字),有效服饰相关约5行
有效发现: - 第62行:衰绖之中(丧服) - 第231行:首饰、银器
过滤掉:"带"字大量无关用法(带着、带来等),"环"字无首饰实义用法
第4轮grep:织物关键词(锦、绢、绸、缎、纱、罗)
搜索命令:rg -n '锦|绢|绸|缎|纱|罗'
命中行数:约10行,有效约5行
有效发现: - 第68行:洋缎的衣裳 - 第224行:纺纱织布等局(非服饰,过滤) - 第277行:月白湖绉 - 第458行:绸绉绫绢等物
过滤掉:第224行"纺纱织布"为工厂名称,非服饰描写
第5轮grep:颜色/纹饰/身份服饰(红、绿、青、紫、绣、蟒、补、顶戴、花翎、朝珠)
搜索命令:rg -n '红|绿|青|紫|绣|蟒|补褂|补子|顶子|顶戴|花翎|朝珠'
命中行数:约30行,有效约20行
有效发现: - 第96行:红伞(官仪) - 第118行:蓝顶子、大花翎、朝珠、补褂、蟒袍 - 第116行:红巾(盖头) - 第231行:深蓝顶子、透亮顶子、红顶子、水晶项子 - 第306行:水晶项子、袍套、补子 - 第371行:红缨大帽 - 第414行:红顶花翎、大马褂、墨晶方眼镜、绿呢大轿 - 第442行:花绫子、红毡铺地 - 第453行:衣服齐整(官场诀窍) - 第461行:蟒袍补褂
过滤掉:大量"红人"(指得势者)、"红封袋"等非服饰用法
第6轮grep:官场/丧服专词(马褂、褂子、翎子、功牌、吉服、素服、孝服、成服、号褂等)
搜索命令:rg -n '马褂|褂子|翎子|功牌|功碑|吉服|素服|孝服|成服|衰绖|朝服|公服|号衣|号褂'
命中行数:约15行,有效约12行
有效发现: - 第62行:衰绖之中 - 第68行:成服 - 第97行:换过马褂 - 第111行:脱了吉服、重新成服、换了素衣 - 第113行:披了一件马褂 - 第141行:吉服到黎大人家 - 第204行:穿了马褂 - 第241行:穿了缺襟袍子、方马褂 - 第311行:缺襟马褂 - 第314行:披上一件马褂 - 第404行:小褂子、套裤 - 第413行:号褂子 - 第522行:孝衣未齐
过滤掉:无
过滤统计
| 轮次 | 命中行 | 有效行 | 过滤率 |
|---|---|---|---|
| 第1轮 | ~25 | 20 | 20% |
| 第2轮 | ~20 | 15 | 25% |
| 第3轮 | 大量 | 5 | >90% |
| 第4轮 | ~10 | 5 | 50% |
| 第5轮 | ~30 | 20 | 33% |
| 第6轮 | ~15 | 12 | 20% |
主要过滤原因: 1. "带"字作为动词(带着、带来)占比极高 2. "红"字用于"红人"(得势者)非颜色服饰 3. "衣"字在某些搭配中为泛指而非具体服饰描写 4. "纱"出现于"纺纱织布局"为工业名词
审查结论
- 全书服饰描写约40条有效记录,数量不多但信息密度高
- 核心服饰集中在官服品级与丧服礼制两个系统
- 最精妙段落:第231行妓女论顶戴品级、第281行"画眉笼子"典故
- 服饰描写的文学功能以讽刺为主,非以审美为主
- 无虚构或生造服饰名称,所有服饰均有清代实物对应
产出文件
| 文件名 | 大小限制 | 内容 |
|---|---|---|
| 胡涂世界_总结.md | ≤20KB | 服饰分类分析与核心发现 |
| 胡涂世界_日志.md | ≤20KB | 本文件,提取流程记录 |
| 胡涂世界_原文提取.md | ≤20KB | 服饰相关原文摘录 |