岕茶汇抄 — 服饰提取日志

书籍信息

提取流程

Step 1: 行数统计

wc -l → 45行,属于小型文本。

Step 2: 六轮grep扫描

轮次关键词类别命中行号
第一轮核心服饰词第19行(带)、第25行(衣)
第二轮冠服制度词第33行(乌纱)
第三轮织物材料词第3/5/9/11/17/33/37/45行(罗、纱等)
第四轮颜色纹饰词第3/5/11/17/19/21/23/25/27/37/45行(紫/赤/青/白/黄/绿/织等)
第五轮配饰器物词第3/5/17行(玉/盖/环等)
第六轮动作制度词无命中

Step 3: 语境审查

对全部命中行进行逐条审查,结果如下:

  1. 第3行:罗(姓氏/地名)、玉(比喻)、环(地名环长兴境)→ 假阳性
  2. 第5行:罗(地名)、青(地名青东)、环(环绕)→ 假阳性
  3. 第9行:罗(地名)→ 假阳性
  4. 第11行:罗(地名)、紫(茶名紫笋)、青(非服饰)→ 假阳性
  5. 第17行:伞盖(遮阳用具)、黄叶(枯叶)→ 假阳性
  6. 第19行:带(动词)、赤(茶色)→ 假阳性
  7. 第21行:白/黄/青(均为茶色)→ 假阳性
  8. 第23行:白(茶色)→ 假阳性
  9. 第25行:苔衣(苔藓覆盖)、玉/绿/黄(茶色比喻)→ 假阳性
  10. 第27行:青(茶色)→ 假阳性
  11. 第33行:乌纱顶(地名)→ 假阳性
  12. 第37行:白(露白)、黄(黄熟香,香料名)→ 假阳性
  13. 第45行:罗(地名)→ 假阳性

Step 4: 去重去噪

六轮共命中13个不同行号,经语境审查,全部为假阳性,无一条保留。

Step 5: 分类审查

无需分类(零有效命中)。

最终结论

本书六轮grep共命中13行,经逐条语境审查,全部为假阳性,无实质服饰内容可提取。