《后观石录》服饰提取日志

基本信息

项目 内容
书名 后观石录
作者 毛奇龄(清)
输入文件 /home/z/my-project/upload/器物/器物/后观石录.txt
输出目录 /home/z/my-project/upload/器物output/后观石录/
文件总行数 50行
关键词总数 44个

处理流程记录

第一步:统计总行数

wc -l 后观石录.txt
# 结果:50行

第二步:逐关键词grep提取

对44个服饰关键词逐一执行 rg -n 搜索:

for kw in 衣 裳 冠 带 袍 裘 褐 巾 履 屦 绅 袂 裾 襟 裙 幅 弁 冕 簪 珥 佩 环 绮 罗 纱 绢 帛 锦 绣 练 絮 布 麻 丝 绸 缎 缯 绫 纨 绡 绶 绂 黼 黻 鹖 帻 帷 帐 幄 旗 旌 旆 纛; do
  result=$(rg -n "$kw" 后观石录.txt 2>/dev/null)
  if [ -n "$result" ]; then echo "=== $kw ==="; echo "$result"; fi
done

命中关键词(10个):衣、带、裘、褐、环、绮、罗、锦、布、丝

未命中关键词(34个):裳、冠、袍、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、纱、绢、帛、绣、练、絮、麻、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛

第三步:逐条人工判读与过滤

对每条命中进行上下文审读,区分有效命中、边际命中与噪音:

行号 关键词 原文片段 判定 理由
1 有布政谢在杭 噪音 布政=官职
2 遍布饰缰繘 噪音 布=动词
2 鞞珌、鞓带 有效 鞓带=皮带,实物
3 两螭环首掉足 噪音 环=弯曲状,非环佩
11 相传狐白裘 有效 狐白裘=白狐裘衣
18 各带红黄色 噪音 带=动词"带有"
18 灰白花锦 有效 锦=织锦纹,比喻
19 灰如旧锦 有效 锦=织锦,比喻
19 宣和丝砚 有效 丝=丝理,比喻
20 色如鹰褐 有效 褐=褐色,比喻
27 岩石俱带红色 噪音 带=动词"带有"
30 初脱衣时 边际 衣=笋壳喻
40 玉带茄花 边际 玉带=石名,源自服饰物
46 衣缨拂之有痕 有效 衣缨=衣冠系带
47 类嘉锦 有效 锦=织锦,比喻
48 微带葱色 噪音 带=动词"带有"
50 绮者 有效 绮=丝织品,比喻
50 吴罗扬彩 有效 罗=丝罗,比喻
50 蜀锦曫文 有效 锦=织锦,比喻
50 如鹰褐 有效 褐=褐色,比喻

第四步:结果统计

类别 数量 说明
有效命中 12条 服饰义或织物比喻义
边际命中 2条 引申义或石名借用服饰词
噪音 6条 非服饰义用词
命中关键词 10个 占词库44个的22.7%
未命中关键词 34个 占词库77.3%

第五步:生成输出文件

文件名 大小限制 状态
后观石录_总结.md ≤20KB ✅ 已生成
后观石录_原文提取.md ≤20KB ✅ 已生成
后观石录_日志.md ≤20KB ✅ 本文件

关键词命中明细

衣  → 第30行(边际)、第46行(有效)           命中2条
裳  → 无命中
冠  → 无命中
带  → 第2行(有效)、第18行(噪音)、第27行(噪音)、第40行(边际)、第48行(噪音)  命中5条
袍  → 无命中
裘  → 第11行(有效)                         命中1条
褐  → 第20行(有效)、第50行(有效)           命中2条
巾  → 无命中
履  → 无命中
环  → 第3行(噪音)                          命中1条
绮  → 第50行(有效)                         命中1条
罗  → 第50行(有效)                         命中1条
锦  → 第18行(有效)、第19行(有效)、第47行(有效)、第50行(有效)  命中4条
布  → 第1行(噪音)、第2行(噪音)             命中2条
丝  → 第19行(有效)                         命中1条
其余30个关键词 → 无命中

处理完成时间

2026-03-05