《端溪砚史》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 端溪砚史 |
| 输入文件 | /home/z/my-project/upload/器物/器物/端溪砚史.txt |
| 输出目录 | /home/z/my-project/upload/器物output/端溪砚史/ |
| 总行数 | 119行 |
| 处理时间 | 2026-03-04 |
处理流程记录
第一步:总行数统计
wc -l 端溪砚史.txt → 119行
第二步:关键词逐字grep -n检索
使用46个服饰关键词逐一检索:
命中关键词(5个):
| 序号 | 关键词 | 命中行数 | 命中条数 |
|---|---|---|---|
| 1 | 带 | 第38、59、66、104、109行 | 8处 |
| 2 | 环 | 第92行 | 2处 |
| 3 | 布 | 第96行 | 1处 |
| 4 | 麻 | 第104、109、117行 | 3处 |
| 5 | 丝 | 第92、96行 | 2处 |
未命中关键词(41个):
衣、裳、冠、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、绮、罗、纱、绢、帛、锦、绣、练、絮、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛
第三步:上下文提取与语境审核
对5个命中关键词的上下文逐一审核:
- 带:全部为"带有、附有"义(形容石色偏调),或为砚石纹路名("白玉带"),无腰带义 → 排除
- 环:全部为"围绕"义("迴環""环绕"),描述纹路形态,非佩饰之环 → 排除
- 布:"纵横布密"为"分布致密"义,非布帛 → 排除
- 麻:"麻雀斑"为砚石瑕疵专称,非麻布 → 排除
- 丝:"藕丝""蛛丝"均为比喻词,形容纹路细密,非丝织品 → 排除
第四步:复合词二次验证
检索"衣裳、衣冠、冠带、布衣、帛衣、锦衣、绣衣、麻衣、裘褐、罗衣、黼黻、冠冕、簪珥、帷帐、旗旌"等复合词——零命中。
第五步:噪音过滤结论
全部5个命中关键词经语境审核后判定为假阳性,有效服饰内容为零。
输出文件
| 文件名 | 大小 | 说明 |
|---|---|---|
| 端溪砚史_总结.md | <5KB | 检索总结与结论 |
| 端溪砚史_原文提取.md | <5KB | 假阳性原文及排除理由 |
| 端溪砚史_日志.md | <5KB | 本文件,处理流程记录 |
最终结论
《端溪砚史》为砚学专书,全篇无服饰相关内容。 46个服饰关键词中5个命中均为假阳性,经逐条语境审核后全部排除。本书内容集中于端砚产地、坑洞、石品、纹理及鉴赏,与服饰制度、衣冠仪礼、织物材料无涉。