《时古对类》服饰提取日志
处理时间:2025年 输入文件:/home/z/my-project/upload/对联/对联/时古对类.txt(50行)
Step 1:文件基本信息
- 文件行数:50行
- 作者:未署名(古代对类汇编)
- 结构:按言数编排(二言~十七言),为经典对句分类合集
- 文件较小,可直接grep全文
Step 2:关键词grep定位
执行命令:用Grep工具搜索关键词词库全部词汇
搜索结果统计: - 命中行数:约15行含关键词 - 其中服饰实质内容行:12条 - 噪音行:约3行需过滤
Step 3:噪音过滤
| 噪音类型 | 示例行号 | 噪音内容 | 过滤理由 |
|---|---|---|---|
| 植物隐喻 | 4 | “荇带,苔衣” | “带”为植物叶带,”衣”为苔藓,非服饰 |
| 植物用语 | 4 | “藕丝” | 丝为藕丝,非纺织丝 |
| 比喻用法 | 28 | “锦绣回文” | 锦绣为文采比喻,非实指织物 |
| 兵器 | 4 | “霜剑,星戈” | 剑、戈为兵器,非服饰 |
Step 4:有效提取
经筛选确认有效服饰行12条,分类如下: - 冠服类:4条 - 衣裳类:3条 - 靴履类:3条 - 佩饰类:2条 - 材质类:2条 - 染色类:2条
部分行含多个分类关键词。
Step 5:关键发现
- 典故化用为主:本书服饰词多用典故,如”弹冠”出《楚辞》,”曳履”出《后汉书·郑玄传》,”缁衣”出《诗经·郑风》,”敝屣”出《孟子》,非实写服饰。
- 三言对最集中:行7的三言对句包含最多服饰词(冠、履、帽、衣、珮、金鱼袋),因三言体要求高度凝练,服饰词密度最高。
- 品级制度痕迹:”金鱼袋”为唐代官制佩饰,银鼠衣为北方御寒裘服,二者对举反映官服制度。
- 纺织意象:行25”丝”“锦”“织”“裁”四词集中于一句,以纺织喻自然景象。
Step 6:审核
- ✅ 所有提取行均有明确行号可溯源
- ✅ 噪音行已过滤(苔衣、藕丝、荇带等植物隐喻)
- ✅ 关键词加粗标注
- ✅ 未整本载入LLM,逐行grep定位
- ✅ 文件大小在20KB限制内