《南齐书》服饰内容提取——操作日志

一、基本信息

项目内容
书名南齐书(南朝梁·萧子显撰)
输入文件/home/z/my-project/upload/zhengshi/正史/南齐书.txt
输出目录/home/z/my-project/upload/正史重制output/南齐书/
文件总行数3573行
提取方法grep -c 统计 → grep -n 定位 → sed -n 提取上下文

二、关键词匹配统计

冠帽类

关键词匹配数服饰相关
237约30条核心
33约20条核心
42条核心
1410条核心
94条核心
145条核心
进贤冠22条核心
武冠44条核心
通天冠11条核心
远游冠33条核心

衣裳类

关键词匹配数服饰相关
155约25条核心
136条核心
107条核心
42条核心
32条核心
423条核心(多为人名/出仕义)
126条核心
深衣11条核心
中衣33条核心
22条核心
74条核心
21条核心

服制类

关键词匹配数服饰相关
朝服1414条核心
祭服22条核心
常服11条核心
公服11条核心
法服11条核心
章服33条核心
燕服11条核心
丧服75条核心
服制33条核心
服色22条核心

颜色类

关键词匹配数服饰相关
89约15条核心
绿185条核心
159约8条核心
234约5条核心
306约8条核心
49约8条核心
72约10条核心
102条核心

佩饰类

关键词匹配数服饰相关
116条核心
22条核心
74约10条核心
1712条核心
75条核心
21条核心

舆服仪仗类

关键词匹配数服饰相关
舆服66条核心
车服118条核心
卤簿44条核心

织物类

关键词匹配数服饰相关
35约5条核心
165条核心
82条核心
32条核心
38约5条核心
2310条核心
95条核心
62条核心
43条核心
52条核心

三、操作流程

1. 行数确认wc -l → 3573行

2. 关键词频次统计:按8大类共46个关键词逐一 grep -c,生成频次表

3. 行号定位:对有匹配的关键词逐一 grep -n 获取行号

4. 核心段落提取

  • sed -n '1782,1843p' 提取舆服志完整段落
  • 对服制类(朝服/祭服/常服/公服/法服/章服/燕服/丧服/服制/服色/冕服/衮服)做精准提取
  • 对冠帽类(冕/弁/帻/巾/帽/进贤冠/武冠/通天冠/远游冠)做精准提取
  • 对舆服/车服/卤簿/绶/佩/袍/裘/褐/簪做精准提取

5. 语义过滤:对高频词(冠/衣/白/黄/青/紫等)去除地名、人名、比喻等非服饰用法

6. 分类归纳:按冕服/冠制/后妃服饰/礼制服饰/政治事件/日常特例/织物颜色7大类组织

四、关键发现

1. 舆服志为南齐服饰制度核心:行1782-1843完整记载车舆62行、冠服40行、佩绶8行

2. 永明改制为最重要制度变革:永明六年冕旒改制(三公七旒→八旒,卿五旒→六旒),王俭议定三公山龙九章、卿华虫七章

3. 建武改制:明帝以织成重改采画衮衣,加金银薄称"天衣"

4. 东昏改簪导:通天冠旧用駮犀簪导,东昏改用玉——反映南朝晚期奢靡风气

5. 齐德尚青争议:伏曼容议五辂五色宜先青,周颙驳之,事不行

6. 高丽冠制记载:冠折风一梁谓之帻,"古弁之遗像也"——珍贵的异族服饰史料

7. 孔雀毛裘:文惠太子织孔雀毛为裘,"光彩金翠过于雉头"——罕见特种织物记载

8. 王俭服制影响:公府长史著朱衣→复朝服,解散髻斜插帻簪为时尚

五、审核结果

  • ✅ 未整本载入LLM,全部通过grep+sed提取
  • ✅ 产出3份MD(总结/日志/原文提取)
  • ✅ 每份≤20KB
  • ✅ 输出目录已创建
  • ✅ 关键词词库全覆盖(46个关键词)
  • ✅ 语义过滤已执行(高频词去除非服饰用法)
  • ✅ 原文提取带行号

六、输出文件

文件路径说明
总结/home/z/my-project/upload/正史重制output/南齐书/南齐书_服饰总结.md分类综述+学术审查
日志/home/z/my-project/upload/正史重制output/南齐书/南齐书_操作日志.md操作流程+关键发现+审核
原文/home/z/my-project/upload/正史重制output/南齐书/南齐书_原文提取.md带行号原文片段