山家清供 — 服饰提取日志
书籍信息
- 书名:山家清供
- 文件路径:/home/z/my-project/upload/饮馔/饮馔/山家清供.txt
- 总行数:432行
提取流程
Step 1: 行数统计
wc -l → 432行,中型文本。
Step 2: 六轮grep扫描
| 轮次 | 关键词类别 | 命中行数 | 命中行号 |
|---|---|---|---|
| 第一轮 | 核心服饰词 | 约20行 | 5/29/33/41/71/75/95/105/107/119/123/197/199/207/227/247/263/267/275/283/287/303/347/403/427 |
| 第二轮 | 冠服制度词 | 2行 | 139/271 |
| 第三轮 | 织物材料词 | 约20行 | 37/41/45/87/95/105/107/143/147/153/195/271/275/299/351/379/423/431 |
| 第四轮 | 颜色纹饰词 | 约50行 | 大量行号 |
| 第五轮 | 配饰器物词 | 约25行 | 17/27/29/33/41/61/71/77/87/109/111/115/119/139/141/155/179/187/195/197/199/211/237/263/273/275/277/291/307/313/315/333/353/387/389/391/427 |
| 第六轮 | 动作制度词 | 0行 | 无 |
Step 3: 语境审查
对全部命中行进行逐条审查,排除假阳性,保留有效服饰内容:
保留(有效服饰内容):
- 第33行:曳履(拖着鞋子,穿着描写)
- 第123行:方巾(文人首服,穿着描写)
- 第275行:三寸褐/被褐怀玉(粗布衣,文学比喻)
- 第283行:衣钵(僧衣传承,引申义)
- 第403行:鞋袜毡褥(鞋袜制作,实际穿着用品)
排除(典型假阳性):
- 第5行"久服益颜":服药,非穿服
- 第29行"服饵":服食,非穿服
- 第41行"布谷":布谷鸟,非布匹
- 第71行"紫帽山":地名,非帽
- 第75行"皂荚子":植物名,非皂色
- 第87/95/351行"绢囊/绢袋":过滤用具,非穿着
- 第105/107行"锦带":花名,非锦带服饰
- 第143/147行"芝麻/麻油":食材,非布料
- 第153行"银丝":比喻琴弦,非丝织
- 第195行"金蓑织几重":诗中蓑衣比喻,稍有关联但为咏莲非写服饰
- 第263/267/303行"服玉/化服/服气":服食/修炼,非穿服
- 第271行"小青锦屏":屏风装饰,非服饰
- 第379行"葛天民":人名,非葛布
- 第427行"煎服":服药,非穿服
Step 4: 去重去噪
六轮共命中约60个不同行号,经语境审查,保留5处有效服饰内容,假阳性率约92%。
Step 5: 分类审查
有效内容按类别分布:
- 冠巾类:方巾(1处)
- 履鞋类:曳履、鞋袜(2处)
- 衣褐类:褐(1处,文学比喻)
- 僧服类:衣钵(1处,引申义)
最终结论
本书有效服饰内容5处,其中3处为实际穿着描写,2处为文学比喻/引申义。服饰内容占比极低,与全书饮食主题关联不深。