《砚谱》服饰内容提取日志
基本信息
- 书名:砚谱
- 输入文件:/home/z/my-project/upload/器物/器物/砚谱.txt
- 输出目录:/home/z/my-project/upload/器物output/砚谱/
- 处理时间:2026-03-05
处理流程
第一步:查总行数
wc -l 砚谱.txt
结果:65行
第二步:多轮关键词grep
使用服饰词库48字逐字检索,共4字命中:
| 关键词 | 命中行号 | 命中次数 |
|---|---|---|
| 冠 | 3 | 1 |
| 丝 | 6, 7, 9, 19 | 4 |
| 布 | 13 | 1 |
| 罗 | 25 | 1 |
其余44个关键词(衣、裳、带、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、环、绮、纱、绢、帛、锦、绣、练、絮、麻、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛)均无命中。
第三步:上下文审读与噪音过滤
对6条命中逐一审读原文上下文:
- 第3行"冠":"天下之冠"——比喻用法,非冠帽 → 排除
- 第6/7/9/19行"丝":"红丝石"——砚石专名 → 排除
- 第13行"布":"布列砚中"——动词,非织物 → 排除
- 第25行"罗":"罗纹金星"——石纹名称 → 排除
全部6条命中均为假阳性,噪音率100%。
第四步:输出文件生成
- 砚谱_总结.md(≤20KB)✓
- 砚谱_原文提取.md(≤20KB)✓
- 砚谱_日志.md(≤20KB)✓
最终结果
| 指标 | 数值 |
|---|---|
| 总行数 | 65 |
| 关键词命中数 | 6条 |
| 噪音排除数 | 6条 |
| 有效服饰条目数 | 0 |
备注
《砚谱》为砚台专谱,内容集中于砚石产地、品类、品鉴与典故,属文房器物类文献,与衣冠服饰无涉。服饰关键词偶有字形命中,均为同字异义用法(专名、比喻、动词),无真实服饰内容。