《后观石录》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 后观石录 |
| 作者 | 毛奇龄(清) |
| 输入文件 | /home/z/my-project/upload/器物/器物/后观石录.txt |
| 输出目录 | /home/z/my-project/upload/器物output/后观石录/ |
| 文件总行数 | 50行 |
| 关键词总数 | 44个 |
处理流程记录
第一步:统计总行数
wc -l 后观石录.txt
# 结果:50行
第二步:逐关键词grep提取
对44个服饰关键词逐一执行 rg -n 搜索:
for kw in 衣 裳 冠 带 袍 裘 褐 巾 履 屦 绅 袂 裾 襟 裙 幅 弁 冕 簪 珥 佩 环 绮 罗 纱 绢 帛 锦 绣 练 絮 布 麻 丝 绸 缎 缯 绫 纨 绡 绶 绂 黼 黻 鹖 帻 帷 帐 幄 旗 旌 旆 纛; do
result=$(rg -n "$kw" 后观石录.txt 2>/dev/null)
if [ -n "$result" ]; then echo "=== $kw ==="; echo "$result"; fi
done
命中关键词(10个):衣、带、裘、褐、环、绮、罗、锦、布、丝
未命中关键词(34个):裳、冠、袍、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、纱、绢、帛、绣、练、絮、麻、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛
第三步:逐条人工判读与过滤
对每条命中进行上下文审读,区分有效命中、边际命中与噪音:
| 行号 | 关键词 | 原文片段 | 判定 | 理由 |
|---|---|---|---|---|
| 1 | 布 | 有布政谢在杭 | 噪音 | 布政=官职 |
| 2 | 布 | 遍布饰缰繘 | 噪音 | 布=动词 |
| 2 | 带 | 鞞珌、鞓带 | 有效 | 鞓带=皮带,实物 |
| 3 | 环 | 两螭环首掉足 | 噪音 | 环=弯曲状,非环佩 |
| 11 | 裘 | 相传狐白裘 | 有效 | 狐白裘=白狐裘衣 |
| 18 | 带 | 各带红黄色 | 噪音 | 带=动词"带有" |
| 18 | 锦 | 灰白花锦 | 有效 | 锦=织锦纹,比喻 |
| 19 | 锦 | 灰如旧锦 | 有效 | 锦=织锦,比喻 |
| 19 | 丝 | 宣和丝砚 | 有效 | 丝=丝理,比喻 |
| 20 | 褐 | 色如鹰褐 | 有效 | 褐=褐色,比喻 |
| 27 | 带 | 岩石俱带红色 | 噪音 | 带=动词"带有" |
| 30 | 衣 | 初脱衣时 | 边际 | 衣=笋壳喻 |
| 40 | 带 | 玉带茄花 | 边际 | 玉带=石名,源自服饰物 |
| 46 | 衣 | 衣缨拂之有痕 | 有效 | 衣缨=衣冠系带 |
| 47 | 锦 | 类嘉锦 | 有效 | 锦=织锦,比喻 |
| 48 | 带 | 微带葱色 | 噪音 | 带=动词"带有" |
| 50 | 绮 | 绮者 | 有效 | 绮=丝织品,比喻 |
| 50 | 罗 | 吴罗扬彩 | 有效 | 罗=丝罗,比喻 |
| 50 | 锦 | 蜀锦曫文 | 有效 | 锦=织锦,比喻 |
| 50 | 褐 | 如鹰褐 | 有效 | 褐=褐色,比喻 |
第四步:结果统计
| 类别 | 数量 | 说明 |
|---|---|---|
| 有效命中 | 12条 | 服饰义或织物比喻义 |
| 边际命中 | 2条 | 引申义或石名借用服饰词 |
| 噪音 | 6条 | 非服饰义用词 |
| 命中关键词 | 10个 | 占词库44个的22.7% |
| 未命中关键词 | 34个 | 占词库77.3% |
第五步:生成输出文件
| 文件名 | 大小限制 | 状态 |
|---|---|---|
| 后观石录_总结.md | ≤20KB | ✅ 已生成 |
| 后观石录_原文提取.md | ≤20KB | ✅ 已生成 |
| 后观石录_日志.md | ≤20KB | ✅ 本文件 |
关键词命中明细
衣 → 第30行(边际)、第46行(有效) 命中2条
裳 → 无命中
冠 → 无命中
带 → 第2行(有效)、第18行(噪音)、第27行(噪音)、第40行(边际)、第48行(噪音) 命中5条
袍 → 无命中
裘 → 第11行(有效) 命中1条
褐 → 第20行(有效)、第50行(有效) 命中2条
巾 → 无命中
履 → 无命中
环 → 第3行(噪音) 命中1条
绮 → 第50行(有效) 命中1条
罗 → 第50行(有效) 命中1条
锦 → 第18行(有效)、第19行(有效)、第47行(有效)、第50行(有效) 命中4条
布 → 第1行(噪音)、第2行(噪音) 命中2条
丝 → 第19行(有效) 命中1条
其余30个关键词 → 无命中
处理完成时间
2026-03-05