研究总结 日志 原文

《诸司职掌》服饰内容提取 · 工作日志

时间:2026-03-05

任务:提取《诸司职掌》全部服饰相关内容,整理为3MD

输入:/home/z/my-project/upload/zhengshu/政书/诸司职掌.txt (283,957 bytes)

输出:/home/z/my-project/upload/政书重制output/诸司职掌/


操作流程

Step 0: 预检

wc -c 诸司职掌.txt → 283,957 bytes(约284KB)

文件>200KB,按规则禁止载整本,使用grep定位+sed提取。

Step 1: 第一轮核心词搜索

rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|...(词库全部核心词)' INPUT
→ 545行命中

Step 2: 第二轮制度动作词搜索

rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' INPUT
→ 4行命中

Step 3: 关键词精确定位

rg -n '冠服|冕服|衮冕|朝服|公服|常服|祭服|丧服|赐服|命妇冠服|仪仗|卤簿|织造|章服|品服|服色' INPUT
→ 定位主要章节:行112-135(目录)、行2115-2217(冠服正文)、行3489-3599(卤簿仪仗)、行4172-4214(织造冠服)

Step 4: sed分段提取

sed -n '2115,2230p' → 冠服全节(皇帝冕服→命妇冠服→房屋器用→冠礼)
sed -n '3489,3600p' → 卤簿+仪仗全节
sed -n '4172,4220p' → 织造+冠服制造全节
sed -n '2460,2475p' → 赐驸马冠带衣服
sed -n '3008,3030p' → 丧葬优给(麻布)
sed -n '4330,4360p' → 丧器服饰

Step 5: 散落条目补充搜索

rg -n '赐.*衣|赐.*冠|赐.*带|赏.*衣|冠带衣服' → 行2466(赐驸马冠带)、行3168(赏赐冠带衣靴)、行4214(给赐衣服冠带)
rg -n '纱帽|纻丝|罗衣|罗裳|绣衣|皮弁|绛纱|赤罗|青罗|白纱|皂领|蔽膝|霞帔|翟衣|燕居|纁裳|玄衣|中单' → 行2118-2346(冠服及婚礼服饰详文)
rg -n '丧服|丧礼|衣衾|棺椁|编衣' → 行1363(丁忧丧服)、行3018-3026(丧葬优给)、行4343-4347(丧器服饰)
rg -n '僭|逾制|违式|禁.*服|服色' → 行1410(朝觐服色)、行2217(服色禁令)

Step 6: 分类整理与排除审查

按词库排除规则逐条审查:

排除项

Step 7: 保存三份文件


关键发现

  1. 冕服四级体系:皇帝十二章→东宫/亲王九章→世子七章,旒数/采色/章纹依次递减
  2. 文武官三服体系:朝服(梁冠+赤罗衣裳)→公服(盘领袍+品色)→常服(补服),各有明确服用场合
  3. 梁冠等第精细:公八梁→侯七梁→伯七梁→一品七梁→二品六梁→九品一梁,笼巾貂蝉仅公侯伯用
  4. 公服品色:一至四品绯、五至七品青、八九品绿(注意:五至七品青袍为明初制度,与后世"五至七品青"不同)
  5. 命妇冠以珠翟数分等:一品五→二至四品四→五六品三→七至九品二
  6. 亲王冠礼三加:网巾→翼善冠+绛纱袍→衮冕+衮服
  7. 婚礼服饰极详:纳征礼物中纻丝/绫/纱/罗/锦各六十疋,燕居服四套,翟衣三套,金钏镯多副
  8. 织造产地定额:蚕丝六万斤(湖州独供),蓝靛十万斤(五府各二万),染料配方三种
  9. 服色禁令严格:玄黄紫三色+龙凤纹禁,违者罪及染造之人
  10. 丧葬以麻布计等:公侯百疋至五六品三十疋

关键踩坑记录


审核清单

审核项 结果
核心词全覆盖 ✅ 545行命中全部审查
制度词全覆盖 ✅ 4行命中全部审查
排除规则执行 ✅ 6项排除,0误收
每MD≤20KB ✅ 原文提取~18KB,总结~9KB,日志~5KB
未载整本 ✅ 最大读取2230-2115=115行片段
关键词按词库 ✅ 严格按fushi-keywords.md执行
OCR异体字保留 ✅ 原貌保留,未强行替换