《方言巧对》服饰提取日志
处理时间:2025年 输入文件:/home/z/my-project/upload/对联/对联/方言巧对.txt(217行)
Step 1:文件基本信息
- 文件行数:217行
- 作者:陈凤占
- 结构:卷上(一东~十五删)+ 卷下(一先~十五咸),按韵部编排的方言对韵体
- 文件较小,可直接grep全文
Step 2:关键词grep定位
执行命令:用Grep工具搜索关键词词库中的全部词汇
搜索结果统计: - 命中行数:约30行含服饰实质内容 - 噪音行:约10行需过滤
Step 3:噪音过滤
| 噪音类型 | 示例行号 | 噪音内容 | 过滤理由 |
|---|---|---|---|
| “衣”作非服饰用法 | 21 | “三节梳头两节穿衣” | 日常泛称,无服饰制度信息 |
| “衣”作泛称 | 32 | “食对衣” | 基本生活对照,无服饰细节 |
| “衣”作泛称 | 33 | “吃饭对穿衣” | 同上 |
| “衣”作泛称 | 198 | “穿爷衣” | 谚语中泛指,无服饰制度 |
| 动物用品 | 63 | “蚂蚁子戴笼头” | 笼头为马具,非人服 |
| 绳索非布 | 172 | “草索对麻绳” | 绳索用途,非服饰材质 |
| “棉”比喻用法 | 206 | “光棍软如棉” | “棉”为比喻,非服饰材质描述 |
Step 4:有效提取
经过滤后,确认有效服饰行31条,分类如下: - 冠服类:7条 - 衣裳类:10条 - 靴履类:9条 - 佩饰类:3条 - 材质类:9条 - 染色类:4条 - 雨具类:1条 - 纺织工艺类:2条
部分行含多个分类关键词,故各分类条数之和大于总行数。
Step 5:关键发现
- 对韵体特征:本书为方言对韵体,服饰词多出现在对仗句中,成对出现(如”皮袍对布褂”“麻布对绫罗”),反映民间对服饰品类的二元分类意识。
- 方言色彩:部分词汇为贵州方言特有用法,如”缘鞋”(边沿镶鞋)、”圈袜”(罗纹袜)、”带带对冠冠”(叠词对法)。
- 社会等级映射:材质对比(麻布vs绫罗、粗麻布vs细花针)折射民间对贫富差距的认知。
- 性别服饰:”小脚鞋”反映缠足文化,”缎褂对罗裙”暗示男女/贵贱服饰区分。
Step 6:审核
- ✅ 所有提取行均有明确行号可溯源
- ✅ 噪音行已过滤并在日志中记录理由
- ✅ 关键词加粗标注
- ✅ 未整本载入LLM,逐行grep定位
- ✅ 文件大小在20KB限制内