钦定钱录 服饰提取日志

基本信息

项目 内容
书名 钦定钱录
输入文件 /home/z/my-project/upload/器物/器物/钦定钱录.txt
输出目录 /home/z/my-project/upload/器物output/钦定钱录/
总行数 5478
处理时间 2026-03-05

处理流程记录

第一步:文件概况

第二步:关键词全量检索

使用42字服饰关键词词库逐一grep检索,统计命中情况:

关键词 命中行数 甄别后保留 备注
1 1 "主衣库"为服饰机构
0 0
1 0 "冠以年号"=前置年号
1 0 "带剑"=佩剑,非衣带
0 0
1 0 "裘曰修"=人名
0 0
0 0
0 0
0 0
1 0 "李绅"=人名
0 0
0 0
0 0
0 0
0 0
1 0 "弁韩"=国名
0 0
0 0
0 0
2 2 均为佩戴习俗
5 0 全为钱币环形/回环读法
0 0
10 0 人名/地名/钱名
0 0
0 0
2 2 丝帛经济/钱帛司
0 0
0 0
0 0
0 0
35 0 全为布币术语
0 0
1 1 "丝绳"系佩
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
4 0 "撒帐"=婚礼撒钱
0 0
2 2 旗帜纹饰
0 0
0 0
0 0
合计 64 7

第三步:上下文提取

对64条命中行逐一执行 sed -n 'N-2,N+2p' 提取上下文,人工甄别服饰相关性。

第四步:噪音过滤

核心过滤逻辑:钱币专书中大量关键词以钱币术语形态出现,需严格区分:

  1. 布(35条→0条):《钦定钱录》全书"布"字均指"布币"(铲形钱币),包括: - 布币品类名:大布、小布、中布、壮布、幼布、么布、弟布、差布、厚布、次布 - 布币专称:货布、布泉、五行大布、长平布、尧布、异布 - 钱币统称:泉布、布货、布刀 - 无一条指纺织品"布"

  2. 环(5条→0条):均为钱币结构或读法: - "其环如大钱"(刀币环形柄) - "回环读之""左环读之"(环形读法) - "形如连环"(钱币形状) - "外环以十二属"(环绕排列) - 无一条指佩环

  3. 罗(10条→0条): - 人名:罗氏、罗中引 - 地名:泥婆罗、突罗朱阇婆 - 钱名:罗纹钱 - 通假:周罗(环绕) - 无一条指丝罗织物

  4. 其他排除: - 冠:动词"冠以"≠冠帽 - 带:"带剑"≠衣带 - 裘:人名≠裘衣 - 绅:人名≠绅带 - 弁:国名弁韩≠弁冠 - 帐:撒帐习俗≠帷帐

第五步:确认保留条目

经逐条甄别,最终保留7条服饰相关内容:

序号 行号 关键词 所在卷 内容摘要
1 1878 卷五 台主衣库(六朝服饰机构)
2 1328 卷五 妇人佩男钱(佩饰民俗)
3 4984 佩、丝 卷十六 辟邪钱施组紃佩之、丝绳系宝镜
4 2138 卷八 米帛涌贵(丝帛经济)
5 3513 卷十二 钱帛司(丝帛财政机构)
6 5025 卷十六 虎符钱扬旗(旗帜纹饰)
7 5126 卷十六 北斗钱丽于旗(旗帜纹饰)

第六步:输出文件

文件名 大小限制 说明
钦定钱录_总结.md ≤20KB 服饰内容分类总结
钦定钱录_原文提取.md ≤20KB 原文引用(不转述)
钦定钱录_日志.md ≤20KB 处理流程与过滤记录

噪音率统计

噪音主要来源:布币术语(35/57=61.4%)、地名/人名(14/57=24.6%)、钱币结构描述(5/57=8.8%)、其他非服饰用法(3/57=5.3%)。

结论

《钦定钱录》为钱币专书,服饰内容极为稀少。42字关键词词库检索命中64条中,89.1%为钱币术语、人名、地名等噪音,仅7条(10.9%)与服饰实质相关。主要涉及主衣库机构、佩饰民俗、丝帛经济角色和厌胜钱旗帜纹饰四个方面,均为零散提及,无系统性服饰论述。