《歙州砚谱》服饰内容提取日志
基本信息
| 项目 |
内容 |
| 书名 |
歙州砚谱 |
| 输入文件 |
/home/z/my-project/upload/器物/器物/歙州砚谱.txt |
| 输出目录 |
/home/z/my-project/upload/器物output/歙州砚谱/ |
| 总行数 |
54行 |
| 执行时间 |
2026-03-05 |
处理流程
步骤1:统计总行数
wc -l 歙州砚谱.txt
# 结果:54行
步骤2:服饰关键词逐一检索
使用48个服饰关键词逐一grep -n检索,结果如下:
| 序号 |
关键词 |
命中行数 |
命中行号 |
| 1 |
罗 |
10 |
4,5,6,7,9,10,12,23,24,25,44 |
| 2 |
帛 |
2 |
17,42 |
| 3 |
丝 |
1 |
24 |
| 4 |
带 |
1 |
37 |
| 5 |
麻 |
2 |
39,42 |
| — |
其余43个关键词 |
0 |
— |
未命中关键词:衣、裳、冠、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、环、绮、纱、绢、锦、绣、练、絮、布、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛
步骤3:提取上下文
使用sed -n提取命中行上下文:
sed -n '16,18p' → 第17行"帛碪"上下文
sed -n '23,26p' → 第24行"绞丝罗纹""刷丝罗纹"上下文
sed -n '41,43p' → 第42行"细帛纹"上下文
步骤4:噪音过滤
| 关键词 |
命中行号 |
原文片段 |
判定 |
理由 |
| 罗 |
4,5,6,7,9,10,12,23,24,25,44 |
"罗纹山""罗纹坑""罗纹"等 |
噪音 |
"罗纹"为砚石纹理专名,非丝织品"罗" |
| 带 |
37 |
"兼带少蜡" |
噪音 |
"带"为动词,非服饰"腰带" |
| 麻 |
39 |
"虾■〈虫麻〉样" |
噪音 |
"虫麻"为"蟆"字拆写,与麻布无关 |
| 麻 |
42 |
"麻石黯色" |
噪音 |
"麻"为形容词"粗糙",非麻布 |
| 帛 |
17 |
"帛碪" |
有效(间接) |
帛碪为捣帛砧石,与帛加工间接相关 |
| 帛 |
42 |
"细帛纹" |
有效(比喻) |
以帛纹喻石纹,比喻用法 |
| 丝 |
24 |
"绞丝罗纹""刷丝罗纹" |
有效(比喻) |
以丝喻石纹,比喻用法 |
步骤5:生成输出文件
| 文件名 |
大小 |
说明 |
| 歙州砚谱_总结.md |
<20KB |
全书服饰内容总结分析 |
| 歙州砚谱_原文提取.md |
<20KB |
有效条目原文及噪音条目 |
| 歙州砚谱_日志.md |
<20KB |
本处理日志 |
检索统计汇总
| 统计项 |
数值 |
| 服饰关键词总数 |
48 |
| 命中关键词数 |
5 |
| 未命中关键词数 |
43 |
| 命中总行数 |
15 |
| 噪音条目数 |
4类(罗9行+带1行+麻2行) |
| 有效条目数 |
3 |
| 直接描述服饰条目 |
0 |
| 比喻用法条目 |
2 |
| 间接关联条目 |
1 |
结论
《歙州砚谱》全书54行,为宋代砚石专书,内容集中于歙砚产地、石品、制法、石病、匠手等,无直接服饰内容。48个服饰关键词中仅5个命中,经噪音过滤后有效条目3条,均为比喻或间接用法,不构成服饰研究的直接材料。