《墨谱法式》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 墨谱法式 |
| 输入文件 | /home/z/my-project/upload/器物/器物/墨谱法式.txt |
| 输出目录 | /home/z/my-project/upload/器物output/墨谱法式/ |
| 总行数 | 408行 |
| 处理时间 | 2026-03-05 |
处理流程记录
步骤1:文件总行数
wc -l 墨谱法式.txt → 408行
步骤2:多轮grep检索
使用ripgrep(rg -n)对46个服饰关键词逐一检索,命中关键词及行号如下:
| 关键词 | 命中行号 |
|---|---|
| 履 | 3 |
| 弁 | 4 |
| 幅 | 223 |
| 罗 | 115, 320, 342 |
| 绢 | 115 |
| 纱 | 154 |
| 布 | 141, 355 |
| 麻 | 379, 381, 385, 387, 389 |
未命中关键词(38个):衣、裳、冠、带、袍、裘、褐、巾、屦、绅、袂、裾、襟、裙、弁(仅人名命中)、冕、簪、珥、佩、环、绮、帛、锦、绣、练、絮、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛
步骤3:上下文提取
对命中行号执行 sed -n 提取上下文(±2行):
- 第1–5行(覆盖行3–4)
- 第113–117行(覆盖行115)
- 第139–143行(覆盖行141)
- 第152–156行(覆盖行154)
- 第221–225行(覆盖行223)
- 第318–322行(覆盖行320)
- 第340–344行(覆盖行342)
- 第353–357行(覆盖行355)
- 第377–391行(覆盖行379–389)
步骤4:噪音过滤
逐条判定15处命中:
| # | 关键词 | 行号 | 原文片段 | 判定 | 理由 |
|---|---|---|---|---|---|
| 1 | 履 | 3 | 仕履亦未详也 | 噪音 | 仕履=官职履历 |
| 2 | 弁 | 4 | 朱弁风月堂诗话 | 噪音 | 朱弁=人名 |
| 3 | 绢 | 115 | 以细绢簁于缸中 | 噪音 | 绢作筛网用 |
| 4 | 罗 | 115 | 或用宻罗上下 | 噪音 | 密罗=细筛 |
| 5 | 罗 | 320 | 新罗大墨二品 | 噪音 | 新罗=地名 |
| 6 | 罗 | 342 | 其色泽如新罗 | 噪音 | 新罗=地名 |
| 7 | 纱 | 154 | 以纱嚢悬透风处 | 噪音 | 纱囊=贮墨袋 |
| 8 | 幅 | 223 | 写千幅纸不耗三分 | 噪音 | 幅=纸张量词 |
| 9 | 布 | 141 | 布灰令宻 | 噪音 | 布=动词铺布 |
| 10 | 布 | 355 | 布置胶饼 | 噪音 | 布=动词排列 |
| 11 | 麻 | 379 | 以麻合灯心 | 噪音 | 麻=灯芯材料 |
| 12 | 麻 | 381 | 麻子油 | 噪音 | 麻子油=油料 |
| 13 | 麻 | 385 | 麻子油二斤 | 噪音 | 同上 |
| 14 | 麻 | 387 | 麻子油 / 麻皮 | 噪音 | 同上 |
| 15 | 麻 | 389 | 大麻子油 | 噪音 | 同上 |
过滤结果:15处命中全部为噪音,0条服饰相关内容。
步骤5:输出文件生成
| 文件名 | 大小 | 说明 |
|---|---|---|
| 墨谱法式_总结.md | <20KB | 总结分析 |
| 墨谱法式_原文提取.md | <20KB | 原文逐条提取与判定 |
| 墨谱法式_日志.md | <20KB | 处理流程日志 |
最终结论
《墨谱法式》为宋代李孝美所撰制墨技术专著(三卷),内容涵盖采松、造窑、发火、取烟、和制、入灰、出灰、磨试八图,十六家墨式,及二十种制墨法。全书408行中,46个服饰关键词命中8个共15处,经逐条验证均为同字异义的非服饰用法。全书不含任何服饰相关内容。