《歙砚说》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 歙砚说 |
| 输入文件 | /home/z/my-project/upload/器物/器物/歙砚说.txt |
| 输出目录 | /home/z/my-project/upload/器物output/歙砚说/ |
| 总行数 | 112行 |
| 处理时间 | 2026-03-04 |
处理步骤
步骤1:wc -l 查总行数
$ wc -l 歙砚说.txt
112 歙砚说.txt
文件共112行,为钦定四库全书本,含《歙砚说》与《辨歙石说》两部分及洪迈跋文。
步骤2:grep -n 逐词检索
对47个服饰关键词逐一执行 rg -n "关键词" 歙砚说.txt,命中结果如下:
| 关键词 | 命中行号 | 命中次数 |
|---|---|---|
| 冠 | 3 | 1 |
| 环 | 3 | 1 |
| 罗 | 4,6,7,8,9,10,13,24,56,57,58,59,60,61,62,63,64,65,66,72,80,83,86,87 | 24 |
| 帛 | 38 | 1 |
| 锦 | 22,70,71 | 3 |
| 布 | 38 | 1 |
| 麻 | 19,36 | 2 |
| 丝 | 24,59,63,87,99 | 5 |
未命中关键词(38个): 衣、裳、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、绮、纱、绢、缎、絮、绸、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛
步骤3:sed -n 提取上下文
对命中行逐一提取全文,确认关键词所在语句完整语境。所有命中行均已完整读取原文,无需额外扩展上下文(各行为独立条目或完整句段)。
步骤4:噪音过滤
对8个命中关键词逐条判定服饰/非服饰用法:
| 关键词 | 行号 | 语境 | 判定 | 理由 |
|---|---|---|---|---|
| 冠 | 3 | 天下冠 | ❌ 噪音 | "冠"为动词"冠绝",非冠帽义 |
| 环 | 3 | 环县皆山 | ❌ 噪音 | "环"为动词"环绕",非佩环义 |
| 罗 | 4—87 | 罗纹 | ✅ 保留 | "罗纹"取义于丝罗织纹,属织物类比 |
| 罗 | 72 | 罗汉 | ❌ 噪音 | "罗汉"为佛教音译词,与丝罗无关 |
| 帛 | 38 | 布帛纹 | ✅ 保留 | 帛为丝织品专名 |
| 锦 | 22,70,71 | 锦蹙 | ✅ 保留 | 锦为锦缎织物专名 |
| 布 | 38 | 布帛纹 | ✅ 保留 | 布为布匹专名 |
| 麻 | 19,36 | 麻石 | ❌ 噪音 | "麻"为形容词"粗",非麻布义 |
| 丝 | 24,59,63,87,99 | 刷丝/丝縠 | ✅ 保留 | 丝为蚕丝织物专名 |
过滤后有效关键词:5个(罗、锦、帛、布、丝)
步骤5:输出文件
| 文件名 | 大小 | 说明 |
|---|---|---|
| 歙砚说_总结.md | <20KB | 服饰内容总结分析 |
| 歙砚说_原文提取.md | <20KB | 有效原文逐条提取 |
| 歙砚说_日志.md | <20KB | 本处理日志 |
提取统计
| 统计项 | 数值 |
|---|---|
| 总行数 | 112 |
| 关键词总数 | 47 |
| 命中关键词数 | 8(含噪音) |
| 有效关键词数 | 5 |
| 噪音关键词数 | 3(冠、环、麻) |
| 有效原文条目数 | 20 |
| 噪音排除条目数 | 5 |
| 服饰穿着类条目 | 0 |
| 织物类比类条目 | 20 |
| 服饰制度/礼仪类条目 | 0 |
结论
《歙砚说》为砚石专书,全篇无一处涉及实际服饰穿着、服饰制度或礼仪规范。服饰关键词的命中全部为织物类比用法——以罗、锦、帛、布、丝等织物品名描述砚石纹理质感,反映宋代器物鉴赏中以织喻石的审美传统。