《砚史》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 砚史 |
| 作者 | 宋·米芾 |
| 输入文件 | /home/z/my-project/upload/器物/器物/砚史.txt |
| 输出目录 | /home/z/my-project/upload/器物output/砚史/ |
| 总行数 | 119行 |
处理流程记录
第一步:wc -l 查总行数
119 /home/z/my-project/upload/器物/器物/砚史.txt
第二步:多轮grep -n提取服饰关键词
对50个服饰关键词逐一grep,命中结果如下:
| 关键词 | 命中行号 | 服饰相关 | 备注 |
|---|---|---|---|
| 衣 | 38 | ✅ | "緑色如朝衣",朝衣为官服 |
| 裳 | 34 | ✅ | "色緑如公裳",公裳为官服 |
| 冠 | 6 | ❌ | "首冠以《用品》",冠为动词 |
| 带 | 30 | ❌ | "緑石带黄色",带为动词 |
| 褐 | 72 | ❌ | "褐黄石砚",褐为颜色词 |
| 褐 | 118 | ❌ | "磁褐色",褐为颜色词 |
| 幅 | 34 | ❌ | "二十幅纸",幅为量词 |
| 幅 | 118 | ❌ | "十幅纸",幅为量词 |
| 环 | 118 | ❌ | "环水"/"擢环",环绕义 |
| 罗 | 30 | ⚠️ | "罗纹石",借用织物纹理 |
| 罗 | 34 | ⚠️ | "细罗纹"/"青罗纹",借用织物纹理 |
| 罗 | 98 | ⚠️ | "麤文如罗",以织物喻石纹 |
| 绢 | 82 | ✅ | "熟绢",织物用于制砚工艺 |
| 锦 | 14 | ✅ | "文锦之美",锦缎织物 |
| 布 | 34 | ❌ | "斑斑匀布",布为动词 |
| 丝 | 34 | ⚠️ | "金丝罗纹"/"刷丝罗纹",纹理描述 |
| 丝 | 54 | ⚠️ | "有纹如乱丝",以丝喻纹 |
| 丝 | 96 | ⚠️ | "红丝石",石纹名 |
| 丝 | 98 | ⚠️ | "红丝石",石纹名(同行96条目) |
未命中关键词(32个):袍、裘、巾、履、屦、绅、袂、裾、襟、裙、弁、冕、簪、珥、佩、绮、纱、帛、绣、练、絮、麻、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛
第三步:上下文提取
对全部命中行读取完整原文,确认语境。
第四步:噪音过滤
- 冠(行6):动词"首冠以" → 排除
- 带(行30):动词"带有" → 排除
- 褐(行72、118):颜色词 → 排除
- 幅(行34、118):量词 → 排除
- 环(行118):环绕义 → 排除
- 布(行34):动词"分布" → 排除
第五步:分类整理
- 直接服饰相关:4处(衣/朝衣、裳/公裳、锦/文锦、绢/熟绢)
- 织物纹理借用:5处(罗纹、丝纹相关)
- 噪音排除:6处
输出文件
| 文件名 | 大小 | 说明 |
|---|---|---|
| 砚史_总结.md | <20KB | 服饰内容总结分析 |
| 砚史_原文提取.md | <20KB | 命中原文逐条提取 |
| 砚史_日志.md | <20KB | 本处理日志 |
统计
| 统计项 | 数量 |
|---|---|
| 服饰关键词总数 | 50 |
| 命中关键词数 | 6 |
| 命中原文行数 | 9 |
| 有效服饰提取 | 4处 |
| 织物纹理借用 | 5处 |
| 噪音排除 | 6处 |
| 未命中关键词 | 32个 |
结论
《砚史》为砚学专书,服饰内容极稀薄。全部服饰关键词命中均为比喻或工艺用途,无实质性服饰制度、穿戴描写内容。这与该书专论砚石品类的性质一致。