山家清供 — 服饰提取日志

书籍信息

提取流程

Step 1: 行数统计

wc -l → 432行,中型文本。

Step 2: 六轮grep扫描

轮次关键词类别命中行数命中行号
第一轮核心服饰词约20行5/29/33/41/71/75/95/105/107/119/123/197/199/207/227/247/263/267/275/283/287/303/347/403/427
第二轮冠服制度词2行139/271
第三轮织物材料词约20行37/41/45/87/95/105/107/143/147/153/195/271/275/299/351/379/423/431
第四轮颜色纹饰词约50行大量行号
第五轮配饰器物词约25行17/27/29/33/41/61/71/77/87/109/111/115/119/139/141/155/179/187/195/197/199/211/237/263/273/275/277/291/307/313/315/333/353/387/389/391/427
第六轮动作制度词0行

Step 3: 语境审查

对全部命中行进行逐条审查,排除假阳性,保留有效服饰内容:

保留(有效服饰内容)

  1. 第33行:曳履(拖着鞋子,穿着描写)
  2. 第123行:方巾(文人首服,穿着描写)
  3. 第275行:三寸褐/被褐怀玉(粗布衣,文学比喻)
  4. 第283行:衣钵(僧衣传承,引申义)
  5. 第403行:鞋袜毡褥(鞋袜制作,实际穿着用品)

排除(典型假阳性)

Step 4: 去重去噪

六轮共命中约60个不同行号,经语境审查,保留5处有效服饰内容,假阳性率约92%。

Step 5: 分类审查

有效内容按类别分布:

最终结论

本书有效服饰内容5处,其中3处为实际穿着描写,2处为文学比喻/引申义。服饰内容占比极低,与全书饮食主题关联不深。