《砚谱》服饰内容提取日志

基本信息

处理流程

第一步:查总行数

wc -l 砚谱.txt
结果:65行

第二步:多轮关键词grep

使用服饰词库48字逐字检索,共4字命中:

关键词 命中行号 命中次数
3 1
6, 7, 9, 19 4
13 1
25 1

其余44个关键词(衣、裳、带、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、环、绮、纱、绢、帛、锦、绣、练、絮、麻、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛)均无命中。

第三步:上下文审读与噪音过滤

对6条命中逐一审读原文上下文:

  1. 第3行"冠":"天下之冠"——比喻用法,非冠帽 → 排除
  2. 第6/7/9/19行"丝":"红丝石"——砚石专名 → 排除
  3. 第13行"布":"布列砚中"——动词,非织物 → 排除
  4. 第25行"罗":"罗纹金星"——石纹名称 → 排除

全部6条命中均为假阳性,噪音率100%。

第四步:输出文件生成

最终结果

指标 数值
总行数 65
关键词命中数 6条
噪音排除数 6条
有效服饰条目数 0

备注

《砚谱》为砚台专谱,内容集中于砚石产地、品类、品鉴与典故,属文房器物类文献,与衣冠服饰无涉。服饰关键词偶有字形命中,均为同字异义用法(专名、比喻、动词),无真实服饰内容。