后汉书八家辑注 — 服饰提取日志

基本信息

  • 书名:后汉书八家辑注
  • 源文件:/home/z/my-project/upload/zhengshi/正史/后汉书八家辑注.txt
  • 输出目录:/home/z/my-project/upload/正史重制output/后汉书八家辑注/
  • 源文件行数:6978行
  • 处理日期:2026-03-05

处理流程

步骤1:文件统计

  • wc -l 确认源文件6978行
  • mkdir -p 创建输出目录

步骤2:关键词grep统计

使用服饰关键词词库,分8大类逐一grep -c统计:

关键词命中行数备注
36含"冠族""冠军"等非服饰用法约11条
2均为服饰相关
1皮弁素积
7均为服饰相关
34含"黄巾"约15条(起义相关非服饰)
帽/幞头/武冠/通天冠/远游冠0无命中
进贤冠1狗着进贤冠
85含大量非服饰用法,过滤后约40条服饰相关
6均为服饰相关
5均为服饰相关
3均为服饰相关
5含地名"菟裘"1条
4均为服饰相关
3均为服饰相关
衫/袄/深衣/中衣/裤/半袖0无命中
朝服4均为服饰相关
丧服2均为服饰相关
常服1常服麤粝
服制1衣冠车服制度
衮服/冕服/祭服/公服/法服/章服/燕服0无命中
8含"紫芝""紫宫"等非服饰约3条
1绯囊(非服饰,石灰囊)
绿3含地名等
41绝大多数非服饰,"青绶"2条有效
1285绝大多数为人名/年号,"黄巾"约15条有效
97"白衣""白布"等约5条有效
14"黑帻"2条有效
141"朱衣"等极少服饰用法
1地名,非服饰
18佩刀/佩韦/佩印绶,约15条有效
25均为服饰相关(印绶制度)
16服饰相关约6条(革带/腰带)
笏/鱼袋/鞶囊/香囊/簪/钗0无命中
步摇1目录条目
舆服7均为制度相关
车服2均为制度相关
卤簿/仪仗0无命中
16约12条服饰相关
6约4条服饰相关
21条有效
1有效
14约2条服饰相关(罗縠)
5约2条服饰相关(锦被)
6约5条服饰相关
缎/纱/绸/缟/纨0无命中
赐服/赐紫/赐绯/借紫/借绯/品色/服色/冠带0无命中

步骤3:grep -n提取行号

对有效关键词执行grep -n提取行号,然后对高频单字关键词(衣/冠/巾/带等)附加二次过滤条件(如"衣冠|布衣|衣服|单衣|衣不|赐衣"等),剔除人名、地名、成语等非服饰用法。

步骤4:sed上下文提取

对关键行号执行sed -n提取原文,人工审阅确认服饰相关性。

步骤5:分类编排

将筛选后的约120条有效服饰信息按8大类编排:

1. 冠帽类(冕/弁/帻/巾/冠)

2. 衣裳类(衣/裳/袍/褐/裘/襦/裙)

3. 服制类(朝服/丧服/常服/服制/服妖)

4. 颜色服饰类(紫/绛/赤/黑/皁/白/绶)

5. 佩饰类(佩/带/步摇)

6. 舆服/车服类

7. 织物类(帛/绢/罗/锦/缯/绫/绮)

8. 妆饰类(髻/妆/脂粉)

步骤6:撰写3份MD

  • 后汉书八家辑注_原文提取.md:按类别编排原文段落,标注行号
  • 后汉书八家辑注_总结.md:分类总结核心服饰信息及史料价值
  • 后汉书八家辑注_日志.md:本文件,记录完整处理流程

数据质量问题

1. "黄巾"非服饰:34条"巾"命中中约15条为"黄巾"起义相关,已排除。

2. "冠族/冠军"非服饰:36条"冠"命中中约11条为"冠族""冠军"等非服饰用法,已排除。

3. 高频率色词:黄(1285)、朱(141)、白(97)、青(41)等单字色词命中极多,绝大多数非服饰用法,仅提取组合词(如"黄巾""朱衣""皁袍"等)。

4. "绯"字:唯一命中"绯囊"实为石灰囊,非服饰。

5. 辑佚局限:本书为辑佚之作,服饰记载零散不成系统,无完整舆服志内容,但保存了若干佚史中的珍贵片段。

输出文件

文件名说明
后汉书八家辑注_总结.md服饰内容分类总结
后汉书八家辑注_日志.md处理流程日志(本文件)
后汉书八家辑注_原文提取.md服饰相关原文提取