旧五代史四库 — 服饰史料提取日志

处理信息

项目内容
源文件/home/z/my-project/upload/zhengshi/正史/旧五代史四库.txt
输出目录/home/z/my-project/upload/正史重制output/旧五代史四库/
总行数5,985
处理时间2026-03-05
处理方式grep+sed(Python辅助)

步骤记录

步骤1:wc -l

  • 结果:5,985行

步骤2:grep -c 关键词统计

  • 对71个服饰关键词逐一统计命中数
  • 有命中的关键词:冠(92)、冕(24)、弁(6)、帻(5)、巾(15)、帽(2)、进贤冠(1)、通天冠(2)、衣(156)、裳(7)、袍(17)、衫(6)、褐(24)、裘(10)、深衣(1)、襦(2)、裙(1)、朝服(5)、祭服(3)、常服(5)、公服(1)、法服(2)、章服(4)、丧服(4)、紫(87)、绯(28)、绿(4)、青(156)、黄(159)、白(197)、黑(12)、朱(216)、赭(5)、佩(12)、笏(12)、带(66)、绶(3)、鱼袋(10)、簪(4)、卤簿(15)、仪仗(20)、帛(85)、绮(10)、绫(13)、罗(108)、锦(35)、纱(6)、绸(1)、缯(11)、缟(18)、纨(4)、赐紫(28)、赐绯(19)、赐服(1)、服制(1)、服色(8)、冠带(1)、衣冠(多次)、车服(6)、舆服(1)
  • 无命中:幞头、远游冠、武冠、半袖、鞶囊、香囊、步摇、借紫、借绯、冠制、品色

步骤3:grep -n 行号提取

  • 对冠冕弁帻等头饰关键词提取行号(80条)
  • 对服饰制度关键词(赐紫/赐绯/朝服/章服等)提取行号及上下文(120条)
  • 对密集服饰段落提取±2行上下文

步骤4:sed上下文

  • 重点提取行号:L902, L2022, L2301, L3152, L5282, L5308, L3044, L3170, L3171, L3952, L3957, L3074, L1626, L3006, L1349, L4401, L2489, L3468, L3625, L4173, L1918, L841, L1853, L2412
  • 每行提取最多300字

步骤5-6:撰写3份MD

  • 旧五代史四库_总结.md:统计分析与核心发现
  • 旧五代史四库_日志.md:本文件
  • 旧五代史四库_原文提取.md:按主题分类的原文摘录

数据质量说明

1. 颜色词噪声:青(156)、黄(159)、白(197)、朱(216)大部分为非服饰用法,已甄别

2. "冠"字噪声:92次命中中大量为"弱冠""勇冠""冠军"等非服饰语境

3. "衣"字噪声:156次中部分为"衣冠"(士大夫代称)等非具体服饰描述

4. 四库本局限:《旧五代史》原书舆服志已佚,四库辑本服饰资料零散

关键行号索引

行号内容摘要
L902梁太祖衮冕御朝元殿
L903帝素服避殿(日蚀)
L1626僧晓微赐紫衣后剥服色
L1800庄宗即位制置仗卫法物
L2022明宗服斩衰即位、御衮冕
L2301常服临朝、朝服就位
L2412韩淑妃册封卤簿鼓吹
L3006任圜赐朱绂、赐紫
L3044刘岳撰新书仪
L3074胡装赐绯鱼袋
L3152马缟议嫂叔服制
L3170张承业赐紫
L3171张居翰赐绯
L3952卢质赐绯鱼袋
L5282南汉宫人具冠带预职官
L5308前蜀宫人衣道服金莲花冠