后汉书八家辑注 — 服饰提取日志
基本信息
- 书名:后汉书八家辑注
- 源文件:/home/z/my-project/upload/zhengshi/正史/后汉书八家辑注.txt
- 输出目录:/home/z/my-project/upload/正史重制output/后汉书八家辑注/
- 源文件行数:6978行
- 处理日期:2026-03-05
处理流程
步骤1:文件统计
wc -l确认源文件6978行mkdir -p创建输出目录
步骤2:关键词grep统计
使用服饰关键词词库,分8大类逐一grep -c统计:
| 关键词 | 命中行数 | 备注 |
|---|---|---|
| 冠 | 36 | 含"冠族""冠军"等非服饰用法约11条 |
| 冕 | 2 | 均为服饰相关 |
| 弁 | 1 | 皮弁素积 |
| 帻 | 7 | 均为服饰相关 |
| 巾 | 34 | 含"黄巾"约15条(起义相关非服饰) |
| 帽/幞头/武冠/通天冠/远游冠 | 0 | 无命中 |
| 进贤冠 | 1 | 狗着进贤冠 |
| 衣 | 85 | 含大量非服饰用法,过滤后约40条服饰相关 |
| 裳 | 6 | 均为服饰相关 |
| 袍 | 5 | 均为服饰相关 |
| 褐 | 3 | 均为服饰相关 |
| 裘 | 5 | 含地名"菟裘"1条 |
| 襦 | 4 | 均为服饰相关 |
| 裙 | 3 | 均为服饰相关 |
| 衫/袄/深衣/中衣/裤/半袖 | 0 | 无命中 |
| 朝服 | 4 | 均为服饰相关 |
| 丧服 | 2 | 均为服饰相关 |
| 常服 | 1 | 常服麤粝 |
| 服制 | 1 | 衣冠车服制度 |
| 衮服/冕服/祭服/公服/法服/章服/燕服 | 0 | 无命中 |
| 紫 | 8 | 含"紫芝""紫宫"等非服饰约3条 |
| 绯 | 1 | 绯囊(非服饰,石灰囊) |
| 绿 | 3 | 含地名等 |
| 青 | 41 | 绝大多数非服饰,"青绶"2条有效 |
| 黄 | 1285 | 绝大多数为人名/年号,"黄巾"约15条有效 |
| 白 | 97 | "白衣""白布"等约5条有效 |
| 黑 | 14 | "黑帻"2条有效 |
| 朱 | 141 | "朱衣"等极少服饰用法 |
| 赭 | 1 | 地名,非服饰 |
| 佩 | 18 | 佩刀/佩韦/佩印绶,约15条有效 |
| 绶 | 25 | 均为服饰相关(印绶制度) |
| 带 | 16 | 服饰相关约6条(革带/腰带) |
| 笏/鱼袋/鞶囊/香囊/簪/钗 | 0 | 无命中 |
| 步摇 | 1 | 目录条目 |
| 舆服 | 7 | 均为制度相关 |
| 车服 | 2 | 均为制度相关 |
| 卤簿/仪仗 | 0 | 无命中 |
| 帛 | 16 | 约12条服饰相关 |
| 绢 | 6 | 约4条服饰相关 |
| 绮 | 2 | 1条有效 |
| 绫 | 1 | 有效 |
| 罗 | 14 | 约2条服饰相关(罗縠) |
| 锦 | 5 | 约2条服饰相关(锦被) |
| 缯 | 6 | 约5条服饰相关 |
| 缎/纱/绸/缟/纨 | 0 | 无命中 |
| 赐服/赐紫/赐绯/借紫/借绯/品色/服色/冠带 | 0 | 无命中 |
步骤3:grep -n提取行号
对有效关键词执行grep -n提取行号,然后对高频单字关键词(衣/冠/巾/带等)附加二次过滤条件(如"衣冠|布衣|衣服|单衣|衣不|赐衣"等),剔除人名、地名、成语等非服饰用法。
步骤4:sed上下文提取
对关键行号执行sed -n提取原文,人工审阅确认服饰相关性。
步骤5:分类编排
将筛选后的约120条有效服饰信息按8大类编排:
1. 冠帽类(冕/弁/帻/巾/冠)
2. 衣裳类(衣/裳/袍/褐/裘/襦/裙)
3. 服制类(朝服/丧服/常服/服制/服妖)
4. 颜色服饰类(紫/绛/赤/黑/皁/白/绶)
5. 佩饰类(佩/带/步摇)
6. 舆服/车服类
7. 织物类(帛/绢/罗/锦/缯/绫/绮)
8. 妆饰类(髻/妆/脂粉)
步骤6:撰写3份MD
- 后汉书八家辑注_原文提取.md:按类别编排原文段落,标注行号
- 后汉书八家辑注_总结.md:分类总结核心服饰信息及史料价值
- 后汉书八家辑注_日志.md:本文件,记录完整处理流程
数据质量问题
1. "黄巾"非服饰:34条"巾"命中中约15条为"黄巾"起义相关,已排除。
2. "冠族/冠军"非服饰:36条"冠"命中中约11条为"冠族""冠军"等非服饰用法,已排除。
3. 高频率色词:黄(1285)、朱(141)、白(97)、青(41)等单字色词命中极多,绝大多数非服饰用法,仅提取组合词(如"黄巾""朱衣""皁袍"等)。
4. "绯"字:唯一命中"绯囊"实为石灰囊,非服饰。
5. 辑佚局限:本书为辑佚之作,服饰记载零散不成系统,无完整舆服志内容,但保存了若干佚史中的珍贵片段。
输出文件
| 文件名 | 说明 |
|---|---|
| 后汉书八家辑注_总结.md | 服饰内容分类总结 |
| 后汉书八家辑注_日志.md | 处理流程日志(本文件) |
| 后汉书八家辑注_原文提取.md | 服饰相关原文提取 |