《野菜赞》服饰内容提取日志
任务信息
- 任务ID: 14-4
- 输入文件: /home/z/my-project/upload/草木鸟兽虫鱼/草木鸟兽虫鱼/野菜赞.txt
- 输出目录: /home/z/my-project/upload/草木鸟兽虫鱼output/野菜赞/
- 处理时间: 2026年
操作步骤
步骤1:确认文件大小
wc -c 野菜赞.txt
结果: 14,470字节,95行,属小型文本文件。
步骤2:第1轮grep——核心词搜索
for kw in 衣 裳 服 冠 帽 巾 带 履 鞋 袜 裘 袍 裙 袂 衿 襟; do
grep -n "$kw" 野菜赞.txt
done
命中结果:
- "衣" → 第49、85、86行(3处,全部有效:粘衣、衣絮)
- "服" → 第12、16、37、78、80行(5处,全部假阳性:服用/食用)
- "冠" → 第41行(1处,假阳性:鸡冠苋=植物名)
- "带" → 第11行(1处,假阳性:带土处)
- 其余词未命中
步骤3:第2轮grep——材质词搜索
for kw in 丝 帛 绢 锦 绮 绫 罗 缎 纱 绸 麻 葛 布 绵 毡 褐 裘; do
grep -n "$kw" 野菜赞.txt
done
命中结果:
- "麻" → 第11、42、75行(3处,假阳性:麻子油、胡麻、麻点)
- "葛" → 第71、72行(2处,假阳性:葛根、葛藤)
- "布" → 第7、25、26、51、58、69行(6处,假阳性:布袋、布地、布谷)
- 其余词未命中
步骤4:第3轮grep——制度词搜索
for kw in 舆服 冠服 章服 服色 品服 命服 朝服 祭服 丧服 吉服; do
grep -n "$kw" 野菜赞.txt
done
命中结果: 10词全部未命中。
步骤5:第4轮grep——配饰词搜索
for kw in 佩 玉 笏 簪 钗 钏 环 珮 鱼袋 幞头; do
grep -n "$kw" 野菜赞.txt
done
命中结果:
- "玉" → 第24行(1处,边缘:玉环喻食物)
- "簪" → 第53、87行(2处,全部有效:簪花辟疫、金簪喻花蕾)
- "环" → 第11、24行(2处,1处边缘:银环验毒,1处玉环喻食物)
步骤6:第5轮grep——工艺词搜索
for kw in 织 染 绣 裁 缝 缫 纺 练 煮; do
grep -n "$kw" 野菜赞.txt
done
命中结果:
- "染" → 第51行(1处,有效:可染色)
- "煮" → 第15、17、21、33、37、47、59行(7处,假阳性:煮食方法)
- 其余词未命中
步骤7:噪音过滤与学术审查
对21处命中进行逐条审查:
| 关键词 | 行号 | 上下文 | 判定 |
|---|---|---|---|
| 粘衣 | 49 | "子细粘衣" | ✅ 有效:衣物与自然互动 |
| 粘衣 | 85 | "粘衣难脱" | ✅ 有效:衣物与自然互动 |
| 衣絮 | 86 | "莽行衣絮" | ✅ 有效:衣物与自然互动 |
| 簪 | 53 | "妇女小儿簪之" | ✅ 有效:簪花辟疫习俗 |
| 金簪 | 87 | "未放者名金簪" | ✅ 有效:首饰名喻花蕾 |
| 可染色 | 51 | "可染色者是也" | ✅ 有效:纺织染色 |
| 银环 | 11 | "银环同煼" | ⚠️ 边缘:首饰验毒 |
| 玉环 | 24 | "玉环瑶柱" | ⚠️ 边缘:首饰喻食物 |
| 服×5 | 12/16/37/78/80 | "服之""久服" | ❌ 假阳性:服用 |
| 鸡冠苋 | 41 | 植物名 | ❌ 假阳性 |
| 带土 | 11 | "带土处" | ❌ 假阳性 |
| 麻×3 | 11/42/75 | 麻子油/胡麻/麻点 | ❌ 假阳性 |
| 葛×2 | 71/72 | 葛根/葛藤 | ❌ 假阳性 |
| 布×6 | 7/25/26/51/58/69 | 布袋/布地/布谷 | ❌ 假阳性 |
| 煮×7 | 7处 | 煮食方法 | ❌ 假阳性 |
结论: 6处有效,2处边缘,13处假阳性。
步骤8:产出三份MD文档
- 野菜赞_总结.md ✅
- 野菜赞_日志.md ✅
- 野菜赞_原文提取.md ✅
最终结论
本书检出服饰相关有效内容6处+边缘2处。 最有价值者为"簪花辟疫"民俗记录与"粘衣""衣絮"等衣物自然环境互动描写。全书为野菜赞体诗文,服饰内容有民俗特色。