《马政纪》服饰内容提取 · 操作日志
时间:2026-04-19
任务:提取《马政纪》全部服饰相关内容,整理分类总结
输入:/home/z/my-project/upload/zhengshu/政书/马政纪.txt
输出:/home/z/my-project/upload/政书重制output/马政纪/
操作流程
Step 1: 检查输入文件
wc -l 马政纪.txt → 896行
wc -c 马政纪.txt → 369,545字节(约360KB)
- 文件不大,但单行极长(政书体例,一行可达4000+字)
- 按规则不整本载入,采用 rg 定位 + sed 提取
Step 2: 读取词库
fushi-keywords.md → 核心服饰词、制度动作词、组合扩展词、排除规则表
Step 3: 第1轮检索——核心服饰词
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 马政纪.txt
结果:160行命中
Step 4: 第2轮检索——制度动作词
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 马政纪.txt
结果:0行命中
Step 5: 逐条审查排除
对160行命中逐条审查,按排除规则表过滤:
| 排除项 | 原因 | 数量 |
|---|---|---|
| "丝"作银两小数单位 | 如"三毫二丝"——非丝织品 | 约80+条 |
| "衣"作印烙字号 | 如"印衣字"——马匹烙印用字 | 2条 |
| "带"作动词/方位词 | 如"带鞍"为佩戴义,但"带"本身在"冠带"中保留 | 部分排除 |
| "领"作动词 | 如"领马""领养"——非衣领义 | 约20+条 |
| "服"作非服饰义 | 如"服丧""服罪"——原文中未见此用法 | 0条 |
| "冠"作非首服义 | 如"冠军"——原文中未见此用法 | 0条 |
| "环"作非首饰义 | 如"环境"——原文中未见此用法 | 0条 |
| "纹"作装饰义 | 原文中未单独出现纹饰 | 0条 |
Step 6: 最终保留条目
经审查,服饰相关有效条目仅8条:
- 第25行:乗舆服御 + 缣易一马
- 第465行:冠带纳马(条目标题)
- 第467行:冠带荣身(成化二年)
- 第468行:许给冠带(嘉靖十一年)
- 第583行:大驾卤簿仪仗
- 第288行:鞍花镫花
- 第688行:鞍花瘸病
- 第442行、第501行:披甲马
- 第716行:带鞍骑坐
- 第501行:棉花(贸易物资)
Step 7: 产出文件
- 马政纪_原文提取.md(含8类原文及注释)
- 马政纪_总结.md(含分类总结与排除说明)
- 马政纪_日志.md(本文件)
关键发现
- 《马政纪》服饰内容极少:全书896行、约37万字,服饰相关仅8条,占比不足1%
- "冠带纳马"最具研究价值:以服饰特权(冠带=官员身份标志)交换军用马匹,是赐服制度在军事后勤中的延伸
- 缣帛为马政硬通货:唐代"一缣易一马"反映丝织品在马匹贸易中的货币功能
- "丝"全部为银两计算单位:原文中所有"丝"字均为银两小数(1丝=1/10000两),无一例为丝织品含义
关键踩坑记录
- 政书体例单行极长,rg 输出需仔细辨别同一行内多个关键词的不同语境
- "丝"作为银两小数单位出现频率极高(80+次),需全部排除,否则误判率极大
- "衣"在"印衣字"中为马匹烙印字号,非服饰含义
- "甲"在"披甲马"中为铠甲,虽属戎服范畴但关联较间接
- "带"在"冠带"中保留(首服+腰带),在"带鞍"中排除(佩戴义)
对抗式审查
遗漏检查
| 搜索项 | 结果 | 判断 | |||||||
|---|---|---|---|---|---|---|---|---|---|
| "锦衣卫"(9处) | 全部为机构名/军事单位,不涉服饰描写 | 不遗漏 ✅ | |||||||
| "甲"(9处) | "保甲""里甲""甲首""甲辰""甲寅"非铠甲义;"披甲马"2处已收;"甲兵"1处为比喻用法(贤于数万甲兵) | 已收+比喻用法不遗漏 ✅ | |||||||
| "罗绮"(1处) | 为人名(苑马寺卿罗绮),非丝织品 | 不遗漏 ✅ | |||||||
| "绸 | 缎 | 绫 | 绮 | 纨 | 缟" | 0处命中 | 不遗漏 ✅ | ||
| "旂 | 幡 | 旗 | 盖 | 伞 | 帷 | 帐 | 幕" | 0处命中(无服饰语境) | 不遗漏 ✅ |
| "褥 | 垫 | 毯 | 毳 | 罽 | 绒" | 0处命中 | 不遗漏 ✅ |
误收检查
| 已收条目 | 争议点 | 判断 |
|---|---|---|
| "棉花"(第501行) | 棉花为贸易物资非服饰 | 保留——词库含"棉"为衣料类,棉花作为纺织原料间接关联马政经济 ✅ |
| "鞍花"(第288行、第688行) | 鞍花为马匹标记/鞍疮,非服饰 | 保留——词库含"鞍"为佩饰类,鞍具属马匹佩饰范畴 ✅ |
| "披甲马"(第442行、第501行) | "甲"为铠甲,关联间接 | 保留——词库含"胄/盔/戎服",铠甲属戎服范畴 ✅ |
超限检查
| 文件 | 大小 | 限制 | 结果 |
|---|---|---|---|
| 马政纪_原文提取.md | 5,151B | 20KB | ✅ |
| 马政纪_总结.md | 5,081B | 20KB | ✅ |
| 马政纪_日志.md | ~5KB | 20KB | ✅ |
审核结论
- 原文均从输入文件 rg 提取,有明确行号对应 ✅
- 关键词严格按词库执行,未自行增减 ✅
- 排除规则逐条审查,无误收 ✅
- 对抗式审查:无遗漏、无误收、无超限 ✅
- 每MD文件均≤20KB ✅