《歙砚说辨歙石说》服饰内容提取日志
任务信息
| 项目 | 内容 |
|---|---|
| 书名 | 歙砚说辨歙石说 |
| 输入文件 | /home/z/my-project/upload/器物/器物/歙砚说辨歙石说.txt |
| 输出目录 | /home/z/my-project/upload/器物output/歙砚说辨歙石说/ |
| 总行数 | 171行 |
| 书籍性质 | 宋代器物类专著(砚石) |
| 处理时间 | 2026-03-04 |
处理流程
第一步:查总行数
wc -l 歙砚说辨歙石说.txt
→ 171行
第二步:多轮grep提取服饰关键词行号
使用词库全部43个关键词逐一grep,共命中7个关键词:
| 关键词 | 命中行号 |
|---|---|
| 冠 | 14 |
| 环 | 14 |
| 罗 | 16, 20, 22, 24, 26, 30, 36, 58, 60, 62, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 134, 150, 156, 162, 164 |
| 帛 | 84 |
| 锦 | 56, 130, 132 |
| 布 | 84 |
| 麻 | 48, 80 |
| 丝 | 60, 62, 108, 116, 164, 168 |
其余关键词(衣、裳、带、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、绮、纱、绢、练、絮、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛)均无命中。
第三步:sed提取上下文
对命中行执行 sed -n 提取上下文(上下各2行),共提取以下行段: - 第82-86行(布帛纹上下文) - 第54-57行(锦蹙眉子名录上下文) - 第100-104行(罗縠上下文) - 第128-133行(锦蹙石、锦蹙眉子上下文) - 第166-171行(跋文上下文)
第四步:噪音过滤
逐条审查命中结果,区分服饰用义与非服饰用义:
| 关键词 | 行号 | 原文片段 | 判定 | 理由 |
|---|---|---|---|---|
| 冠 | 14 | "三者为天下冠" | 噪音 | "冠"作"首位"解,非冠帽 |
| 环 | 14 | "环县皆山也" | 噪音 | "环"作"环绕"解,非佩环 |
| 罗 | 16-164行(25处) | "罗纹山""细罗纹""麤罗纹"等 | 噪音(24处) | "罗纹"为砚石纹理分类专名,非罗织物 |
| 罗 | 102 | "石文如罗縠精细" | 有效 | "罗縠"为丝织物名,比喻石纹 |
| 帛 | 84 | "如布帛纹" | 有效 | "布帛"指织物,比喻石病 |
| 锦 | 56, 130, 132 | "锦蹙眉子""如蹙锦然" | 有效 | "蹙锦"为锦缎工艺,命石纹名 |
| 布 | 84 | "如布帛纹" | 有效 | 同帛条 |
| 麻 | 48, 80 | "麻石""麻石黯色" | 噪音 | "麻石"为石名 |
| 丝 | 60-164行(5处) | "刷丝罗纹""刷丝砚"等 | 噪音 | "刷丝"为砚石纹路名 |
| 丝 | 168 | "肌理如丝" | 有效 | 比喻石质细腻如丝 |
过滤统计
- 关键词命中总次数:约35处
- 噪音过滤:约29处
- 有效保留:4处(布帛纹、罗縠、锦蹙/蹙锦、肌理如丝)
- 噪音率:约83%
输出文件清单
| 文件名 | 大小限制 | 说明 |
|---|---|---|
| 歙砚说辨歙石说_总结.md | ≤20KB | 服饰内容总结分析 |
| 歙砚说辨歙石说_原文提取.md | ≤20KB | 有效服饰原文及上下文 |
| 歙砚说辨歙石说_日志.md | ≤20KB | 本日志 |
特别说明
- 本书性质决定服饰内容极少:《歙砚说辨歙石说》为宋代砚石专著,全书专论歙砚产地、石品、纹理、病疵,与服饰制度无涉。
- 织物名仅为比喻修辞:书中出现的布帛、罗縠、锦、丝等织物名,全部用于比喻砚石纹理与质感,非实际衣料记载。
- 罗纹、刷丝为专业术语:虽含"罗""丝"字,实为砚石分类专名,已归为噪音过滤。
- 不凑字不灌水:全书171行,有效服饰语料仅4条,如实记录,不作扩充。