《马首农言》服饰内容提取 · 工作日志
任务ID:6-d 书名:马首农言 文件:/home/z/my-project/upload/农家/农家/马首农言.txt 输出目录:/home/z/my-project/upload/农家重制output/马首农言/ 执行时间:2026-03-05
Step 1:文件基本信息
- 行数:24行(含空行)
- 大小:9,103字节
- 性质:小文件,全文可直接读取
- 作者:[清]祁隽藻
- 内容:山西寿阳(马首)农事谚语汇编
Step 2:读取词库
- 词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md
- 核心服饰词:约90个
- 制度动作词:14个
- 组合扩展词:8组
Step 3:三轮grep
第1轮:核心服饰词
命中行:4、6、8、14(共4行)
| 行号 | 命中关键词 |
|---|---|
| 4 | 裘、丝、麻、桑 |
| 6 | 鞋、裙、衣、麻(胡麻)、布(布裙) |
| 8 | 麻(作物)、茧(茧茧=植物名)、布(布袋) |
| 14 | 绣(绣女) |
第2轮:制度动作词
命中:0行
第3轮:组合扩展词(蚕桑纺织)
| 行号 | 命中关键词 |
|---|---|
| 4 | 桑(桑叶白) |
| 8 | 茧(茧茧=植物名,排除) |
| 12 | 蚕(养蚕) |
Step 4:审查排除
| 关键词 | 原始语境 | 判定 | 理由 |
|---|---|---|---|
| 裘 | "谌夜裘成" | 保留 | 裘服时令标记 |
| 丝 | "虽有丝麻" | 保留 | 丝为衣料 |
| 麻(第4行) | "虽有丝麻" | 保留 | 麻为衣料 |
| 桑(第4行) | "桑叶白" | 保留 | 养蚕时令 |
| 鞋 | "连鞋单布裙" | 保留 | 足服 |
| 裙 | "连鞋单布裙" | 保留 | 下服 |
| 衣 | "行人路上把衣担" | 保留 | 穿着行为 |
| 麻(第6行) | "立夏种胡麻" | 排除 | 胡麻=作物名 |
| 布(第6行) | "单布裙" | 已含于"裙"条 | — |
| 麻(第8行) | "子不种麦亥不麻" | 排除 | 麻=作物种植 |
| 麻(第8行) | "麻三谷六" | 排除 | 麻=作物萌发期 |
| 茧(第8行) | "茧茧开花" | 排除 | 茧茧=植物名 |
| 布(第8行) | "拿布袋装" | 排除 | 布袋=容器 |
| 绣(第14行) | "无绣女" | 保留 | 刺绣=女红 |
| 蚕(第12行) | "养蚕种地" | 保留 | 蚕桑农事 |
有效命中:7条
Step 5:上下文提取
因文件仅24行,已全文读取,无需sed提取。
Step 6:分类
| 类别 | 条数 | 内容 |
|---|---|---|
| 农家服饰习俗 | 2 | 连鞋单布裙、把衣担 |
| 裘服时令 | 1 | 裘成 |
| 丝麻衣料 | 1 | 丝麻 |
| 蚕桑纺织 | 2 | 桑叶白、养蚕 |
| 女红刺绣 | 1 | 绣女 |
Step 7:参考模板
读取了 /home/z/my-project/upload/参考/ 下的三份模板(总结.md、日志.md、原文提取.md),据实创作。
Step 8:输出文件
| 文件 | 大小 | 状态 |
|---|---|---|
| 马首农言_总结.md | ≤20KB | ✅ 已生成 |
| 马首农言_日志.md | ≤20KB | ✅ 本文件 |
| 马首农言_原文提取.md | ≤20KB | ✅ 已生成 |
踩坑记录
- 胡麻≠麻衣:"立夏种胡麻"中"胡麻"为芝麻类作物,与衣料无关
- 茧茧≠蚕茧:"茧茧"为当地植物名(疑为野生豆科),非蚕茧
- 布袋≠布衣:"拿布袋装"之"布"仅为材质,非服饰
- 裘成非本书原创:序中引古谚,非祁隽藻本人记述
丰富度等级:★☆☆☆☆(极贫乏)