《前汉书》服饰内容提取·日志

时间:2026-04-19
任务:提取《前汉书》全部服饰相关内容,整理分类总结
源文件:/home/z/my-project/upload/zhengshi/正史/前汉书.txt(7302行,UTF-8)

操作流程

Step 1: 创建输出目录

`bash

mkdir -p /home/z/my-project/upload/正史重制output/前汉书/

`

Step 2: 查看文件基本信息

`bash

wc -l 前汉书.txt

7302行

file 前汉书.txt

Unicode text, UTF-8 text, with very long lines (4608)

`

Step 3: 对39类关键词执行grep -c统计

冠服类

关键词匹配数关键词匹配数
16315
158
181
幞头0进贤冠2
武冠1通天冠0
远游冠0

衣裳类

关键词匹配数关键词匹配数
21922
22
07
18深衣1
中衣36
00
半袖0

礼服类

关键词匹配数关键词匹配数
衮服0冕服2
朝服8祭服4
常服4公服1
法服3章服6
燕服0丧服12

服色类

关键词匹配数关键词匹配数
440
绿12154
392316
48168
17

佩饰类

关键词匹配数关键词匹配数
381
6688
鱼袋0鞶囊0
香囊04
0步摇0

舆服类

关键词匹配数
舆服7
车服22
卤簿2
仪仗0

织物类

关键词匹配数关键词匹配数
1096
433
5122
02
243
76

动作词

关键词匹配数
赐服0
赐紫0
赐绯0
借紫0
借绯0

制度词

关键词匹配数关键词匹配数
服制5冠制0
品色0章服6
服色18冠带10

Step 4: 提取上下文片段

对匹配数>0的关键词用Python脚本提取行号及前后1行上下文,共命中432行,保存至clothing_extracts.txt。

对高频服色词(青154、黄392、白316、朱168),先做服饰相关过滤(结合衣/服/冠/裳等服饰语境词),但发现过滤后数量仍大,最终决定在撰写MD时手动精选服饰相关内容。

Step 5: 定位关键段落

用Python搜索章节标题,发现:

  • 前汉书无独立舆服志(后汉书始设)
  • 服饰内容主要分布于:帝纪、郊祀志、五行志、各列传
  • 关键服饰段落集中行号:641、849、858-859、895-896、1114、3268-3329、4785-4788、4957、5851、6711-6715

Step 6: 撰写三份MD

按参考模板格式,撰写总结、日志、原文提取三份MD。


关键发现

1. 前汉书无舆服志——这是最重要的发现。前汉书十志中无舆服专篇,服饰内容散布全书

2. 服色制度是核心议题——水德(尚黑)vs土德(尚黄)之争贯穿西汉:张苍据水德、公孙臣贾谊主土德、武帝太初改制定黄德

3. 文帝尚俭为典范——"身衣弋绨"成为后世帝王节俭的标杆

4. 五行志"服妖"独特——将服饰异常解读为政治灾异的预兆,是汉代天人感应思想的体现

5. 佞幸传服饰浮华——"冠鵔鸃贝带傅脂粉"反映佞幸之臣的特殊服制

6. 齐三服官——齐国三服官专供宫廷冠服纨素轻绡,元帝时罢省

7. 刘氏冠——高祖竹皮冠后成制度,非公乘以上不得冠

8. 动作词全部为0——赐服/赐紫/赐绯/借紫/借绯均无匹配,说明这些唐代制度词在前汉书时代尚不存在


审核结果

  • ✅ 所有39类关键词均逐一grep,无遗漏
  • ✅ 高频词(衣219/黄392/白316/朱168)已做服饰语境筛选
  • ✅ 零匹配词(幞头/通天冠/远游冠/衮服/绯/鱼袋/鞶囊/香囊/钗/步摇/仪仗/缎/赐服/赐紫/赐绯/借紫/借绯/冠制/品色)已确认无遗漏
  • ✅ 原文行号均从grep结果对应,可追溯
  • ✅ 三份MD均已检查不超过20KB
  • ⚠️ 部分行因原文极长(单行超4000字),上下文提取时做了截断处理(保留前300字)