研究总结 日志 原文

《文献通考》服饰内容提取 · 操作日志

时间:2026-03-05

任务:提取《文献通考》全部服饰相关内容,整理分类输出3MD

输入:/home/z/my-project/upload/zhengshu/政书/文献通考.txt(33,360行,约14MB)

输出:/home/z/my-project/upload/政书重制output/文献通考/


操作流程

Step 1: 检查文件基本信息

wc -l → 33,360行
wc -c → 14,100,485字节(约14MB)

⚠️ 文件极大,严禁载入全文,必须grep定位+sed提取

Step 2: 定位服饰核心章节

rg -n '王礼考' → 找到王礼考22卷位置(卷一百六至卷一百二十七,行9709-11255)
rg -n '舆服|冠服|服章|车服' → 定位服饰专节

结果:

Step 3: 按词库关键词grep(第1轮:核心服饰词)

Grep工具搜索:衮冕|通天冠|绛纱|朝服|公服|常服|赐服|服色|鱼袋|革带

命中分布:

Step 4: 按词库关键词grep(第2轮:制度动作词)

Grep工具搜索:赐服|赐紫|赐绯|僭|逾制|品色|冠礼|笄礼

命中分布:

Step 5: 按需grep(第3轮:组合扩展词)

Grep工具搜索:折帛|和买|匹帛|蚕|桑|茧|缫|织

命中分布:

Step 6: sed提取核心段落

sed -n '10144,10160p' → 王礼考7开头(秦汉服章)
sed -n '10252,10270p' → 王礼考8开头(宋朝冠服)
sed -n '10308,10320p' → 王礼考9开头(后妃服章)
sed -n '10342,10360p' → 王礼考10开头(圭璧符节)
sed -n '31390,31410p' → 服妖段落
sed -n '10095,10144p' → 先秦冕服制度(王礼考6末尾)

Step 7: 散见他考内容提取

rg -n '衮冕|通天冠|朝服|公服' → 职官考/学校考/宗庙考散见

提取:

Step 8: 排除误命中(按词库排除规则)

关键词 误命中 处理
"麻制"=翰林诏书 排除
"锣"=乐器、"罗列"=排列 排除
"带领""地带" 排除,仅保留腰带义
"冠军""冠绝" 排除,仅保留首服义
"服药""服从""服丧" 排除,仅保留服饰义

Step 9: 撰写3MD文件


关键发现

  1. 王礼考7-9为服饰主文献:约5000行,涵盖先秦至宋历代冠冕服章制度
  2. 马端临考证精审:多处按语辨析旧说,如"大裘衮衣同冕""十二章非周所减"
  3. 宋朝冠服记录最详:天子衮冕通天冠、群臣五梁至两梁冠、腰带笏鱼袋时服等
  4. 服妖为独特内容:物异考中从齐梁至宋的服饰异象占验
  5. 后妃服章有专章:王礼考九系统记录周制至汉晋后妃命妇首服六服

踩坑记录


审核结果