品茶要录 — 服饰提取日志

书籍信息

提取流程

Step 1: 行数统计

wc -l → 58行,小型文本。

Step 2: 六轮grep扫描

轮次关键词类别命中行数命中行号(主要)
第一轮核心服饰词4行9/41/45/53
第二轮冠服制度词0行
第三轮织物材料词0行无(注:"缣"不在词库中)
第四轮颜色纹饰词约10行3/13/25/29/33/41/49等
第五轮配饰器物词4行9/17/37/49/53
第六轮动作制度词0行

Step 3: 语境审查

保留(有效服饰关联内容)

  1. 第9行:"图于缣素"——缣素为细绢与生丝,书画用绢,织物材料旁证

排除(典型假阳性)

注:"缣"不在第三轮织物材料词库中(词库含丝、帛、绢等但不含缣),系通过第一轮grep命中同一行而发现。建议后续可考虑将"缣"纳入织物材料词库。

Step 4: 去重去噪

六轮共命中约12个不同行号,经语境审查,仅保留1处织物材料旁证,假阳性率约92%。

Step 5: 分类审查

唯一有效内容:缣素(书画用绢),属织物材料类旁证,非服饰穿着。

最终结论

本书仅1处织物材料关联内容(缣素),用于书画载体而非服饰。全书无直接服饰描写。