《金石要例》服饰提取日志

基本信息

项目 内容
书名 金石要例
输入文件 /home/z/my-project/upload/器物/器物/金石要例.txt
输出目录 /home/z/my-project/upload/器物output/金石要例/
文件总行数 196
执行时间 2026-03-05

处理流程记录

第一步:wc -l 查总行数

196 /home/z/my-project/upload/器物/器物/金石要例.txt

文件规模较小,共196行。

第二步:逐关键词grep -n检索

对52个服饰关键词逐一执行 rg -n "关键词" 金石要例.txt,结果如下:

关键词 命中行号 命中次数
无命中 0
97 1
21, 51 2
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
13, 109 2
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
51 1
无命中 0
无命中 0
无命中 0
181 1
无命中 0
无命中 0
无命中 0
93, 105 2
109 1
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
无命中 0
179, 189 2
无命中 0
无命中 0
无命中 0

合计:52个关键词中有7个命中(裳、冠、履、罗、锦、布、麻、旗,共8个关键词),涉及10个行号,共12次命中。

第三步:sed -n 提取上下文

对命中行号提取完整行内容,并扩展读取前后文(行179-196、行1-15),确认上下文语义。

第四步:噪音过滤

逐条审查12次命中,判定结果:

行号 关键词 判定 理由
13 噪音 "履歴"=履历,非鞋履
21 噪音 "冠之"=动词,冠于篇首
51 噪音 "序冠篇"=动词
51 噪音 "罗隠"=人名
93 噪音 "田布"=人名
97 噪音 "黄裳"=人名
105 噪音 "布"=曾布,人名
109 噪音 "履恒"=人名
109 噪音 "麻"=姓氏
179 噪音 "旗亭"=酒楼
181 边缘 "成都之锦"比喻文章,涉织物产地但为喻体
189 边缘 "正正之旗"比喻文章,涉旗制但为喻体

噪音率:12次命中中10次为噪音(83.3%),2次为边缘比喻(16.7%),0次为直接服饰描写(0%)。

第五步:输出文件

文件名 大小 说明
金石要例_总结.md <20KB 书目信息、命中分析、结论
金石要例_原文提取.md <20KB 边缘命中原文及噪音排除表
金石要例_日志.md <20KB 本日志,完整处理流程记录

结论

《金石要例》为金石碑版义例学专著,全书196行中无一条直接涉及服饰制度的记载。全部12次关键词命中经上下文审查后,10次为人名/地名/动词等噪音,2次为修辞比喻。本书不具备服饰史料价值。