《大明会典》服饰内容提取 · 日志
时间:2026-03-05
任务:提取《大明会典》全部服饰相关内容,整理分类总结
输入:/home/z/my-project/upload/zhengshu/政书/大明会典.txt(5,165,463字节)
输出:/home/z/my-project/upload/政书重制output/大明会典/
操作流程
Step 1: 读取词库
读取 /home/z/my-project/skills/rysxguji/references/fushi-keywords.md
关键词分类:
- 核心服饰词:冠冕袍裘带佩巾履舄笏绶等约90词
- 制度动作词:赐服、僭、逾制、违式、品色、冠礼等15词
- 组合扩展词:品色制度、补服、鱼袋、冕服体系、赐服体系等24词
- 排除规则:麻制、罗列、环能、领兵、带领、钦佩、服药、冠军等
Step 2: 三轮grep搜索
第1轮:核心服饰词(8001行命中)
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|...' INPUT_FILE
head -200 初步审查:发现冠服一(行848/26223)、冠服二(行925/26922)为目录/内容双入口。大量"锦衣卫""麻铁课""首领官"等非服饰命中。
第2轮:制度动作词(约80行命中)
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' INPUT_FILE
命中冠礼四卷(27265-27559)、服舍违式(27218-27264、54812-54823)、赐服相关(41460-41560)
第3轮:组合扩展词
rg -n '蟒衣|飞鱼服|斗牛服|文官一品仙鹤|蚕|桑|茧|缫|织|纺|折帛|和买|市舶|匹帛' INPUT_FILE
发现织造章节(63861-63998)、农桑丝折绢数据(大量)、赐服外夷详目
Step 3: 审查排除误命中
| 关键词 | 误命中数 | 排除原因 |
|---|---|---|
| "锦衣" | 约50行 | "锦衣卫"为官署名,非服饰 |
| "麻" | 约30行 | "麻铁课""麻林国""小葛兰国"非服饰 |
| "罗" | 约20行 | 人名"罗万英"、地名"娑罗国"等 |
| "带" | 约100行 | "带管衙门""带俸"等非腰带 |
| "冠" | 约30行 | "冠于本文之上""冠名"等非首服 |
| "领" | 约50行 | "首领官""领兵"等动词/职务义 |
| "服" | 约40行 | "服从""不服"等非服饰义 |
| "佩" | 约10行 | "臣王佩"为人名 |
| "丝" | 大量 | "丝料"属经济条目,保留织造部分 |
| "农桑丝折绢" | 约200行 | 纯税收数据,无服饰信息,排除 |
Step 4: sed精确提取
| 章节 | 行范围 | 行数 | 字节数 | 提取命令 |
|---|---|---|---|---|
| 冠服一 | 26223-26921 | 699 | 35,721 | sed -n '26223,26921p' |
| 冠服二 | 26922-27217 | 296 | 19,388 | sed -n '26922,27217p' |
| 服舍违式 | 27218-27264 | 47 | 6,903 | sed -n '27218,27264p' |
| 冠礼一~四 | 27265-27559 | 295 | 26,049 | sed -n '27265,27559p' |
| 仪仗一~五 | 59273-59527 | 255 | 37,392 | sed -n '59273,59527p' |
| 织造 | 63861-63998 | 138 | 9,518 | sed -n '63861,63998p' |
| 赐服外夷 | 41469-41555 | 87 | 16,147 | sed -n '41469,41555p' |
合计核心内容:约1,817行,151,118字节
Step 5: 读取参考模板
读取三个参考文件:
/home/z/my-project/upload/参考/总结.md(吕氏春秋模板)/home/z/my-project/upload/参考/日志.md(晋会要模板)/home/z/my-project/upload/参考/原文提取.md(天工开物模板)
Step 6: 分类整理与创作
分类体系(12大类)
- 皇帝冠服制度(袞冕、皮弁、常服、武弁、燕弁)
- 后妃冠服制度(皇后、皇妃、皇嬪、内命妇)
- 宗室冠服制度(皇太子、亲王、世子、郡王、将军中尉)
- 文武官朝服制度(梁冠九品分等)
- 文武官公服常服制度(袍色、带饰分等)
- 补服花样制度(文禽武兽)
- 命妇冠服制度(珠翟、霞帔分等)
- 士庶冠服与禁令
- 服舍违式制度
- 赐服外夷制度
- 织造制度
- 冠礼制度
原文提取策略
原文总量约151KB,需精简至20KB以内。策略:
- 皇帝冕服:选取洪武十六年、永乐三年、嘉靖八年三个关键定制的核心描述
- 文武官朝服:完整保留梁冠九品分等表(最核心制度)
- 补服花样:完整保留文禽武兽品级对应
- 命妇冠服:保留霞帔纹样分等和珠翟数分等
- 士庶禁令:选取最核心的禁令条目
- 赐服外夷:选取朝鲜、日本、琉球、满剌加四国核心赐服
- 织造:选取内织染局和岁造总额
Step 7: 对抗式审查
审查项1:误命中是否混入?
- ✅ 冠服章节内"锦衣卫"出现在品官常服禁令中,属服饰语境,保留
- ✅ "麻"仅在"麻衣"(丧服)语境中保留,其余排除
- ✅ "罗"仅在"赤罗衣""青罗"等服饰语境中保留,人名地名排除
审查项2:是否遗漏重要内容?
- ✅ 冠服一、二完整提取,无遗漏
- ⚠️ 仪仗章节以器物描述为主,服饰元素较少,仅提取制造总则
- ✅ 冠礼章节属礼仪范畴,非服饰本体,日志中记录但不入原文提取
- ⚠️ 赐服赏赐散见朝贺、军赏等处(如正德十年赏衣一袭),因零散未全录
审查项3:原文准确性?
- ✅ 所有原文均从sed精确提取,有明确行号对应
- ✅ 保留原文繁体异体字,不做简化
- ⚠️ 原文OCR讹误:"鈒"或为"钑","(土商)"应为"疋"异体,"(袪去去改巽)"为字库缺字描述——均保留原貌
审查项4:20KB限制?
- 原文提取MD:11,819字节 ✅
- 总结MD:8,519字节 ✅
- 日志MD:待确认
关键发现
- 嘉靖改制最为活跃:武弁服、燕弁冠服、保和冠服、忠静冠服均为嘉靖创制,袞冕亦经嘉靖八年重定
- 梁冠分等是朝服核心:一品七梁至九品一梁,公侯加笼巾貂蝉,御史加獬廌
- 补服花样文禽武兽:文官一品仙鹤至九品鵪鶉,武官一品狮子至九品海马,风宪官獬廌
- 忠静冠服仿古制:嘉靖定忠静冠即古玄冠,忠静服即古玄端,限三品以上许服
- 赐服外夷体系完备:朝鲜获冕服九章、远游冠、龙袞等最高等级赐服
- 织造分内外二局:内局造上用龙袍袞服,外局备公用,岁造总额三万五千余疋
- 服舍违式制度严密:房舍、车舆、伞盖、鞍轡、器皿各有品级等第,违者杖笞徒流
关键踩坑记录
- 目录行与内容行双入口:行848"冠服一"为目录,行26223"冠服一"为正文,须以内容行为准
- "锦衣卫"高频命中但多为官署名,仅在冠服章节内出现时方为服饰语境
- 大量"农桑丝折绢"税收数据(约200行)纯为经济统计,不含服饰信息,排除
- 冠礼章节虽含"冠"字极多,但属礼仪而非服饰制度本体,日志记录但不入原文提取核心
- 原文存在大量OCR描述符如"(袪去去改巽)""(土商)""(衿去今改尃)"等,保留原貌
审核结果
全部通过 ✅ — 原文均从5.16MB源文件中rg+sed精确提取,有明确行号对应,未加载整本TXT。