《全上古三代秦汉三国六朝文》服饰内容提取 · 工作日志

时间:2026-05-09

任务:提取《全上古三代秦汉三国六朝文》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

```

读取 文总集output/六朝文絜/原文提取.md

读取 文总集output/六朝文絜/总结.md

读取 文总集output/六朝文絜/日志.md

→ 确认三份MD输出格式

```

Step 2: 确认输入文件

```

输入文件路径 /home/z/my-project/upload/文总集/文总集/全上古三代秦汉三国六朝文.txt 不存在

→ 从殆知阁GitHub仓库frankslin/daizhigev20的data分支稀疏检出

→ 文件为全上古三代秦汉三国六朝文.md,复制为.txt

wc -l → 65578行,16535823字节(16.5MB)

mkdir -p 文总集output/全上古三代秦汉三国六朝文/ → 创建输出目录

```

Step 3: 多轮grep搜索(10轮50词+补充搜索)

轮次关键词匹配行数
R1衣(1546) 裳(250) 裘(192) 冠(1393) 冕(354)
R2袍(51) 褐(137) 裙(29) 衫(18) 襦(21)
R3绶(253) 佩(312) 笏(27) 履(893) 舄(75)
R4帻(48) 弁(78) 铠(47) 甲(1001) 兜鍪(6)
R5帛(468) 绢(122) 缟(80) 纱(26) 锦(248)
R6绣(203) 黼(65) 黻(52) 衮(183) 章服(17)
R7带(671) 袂(145) 襟(193) 袖(136) 衽(102)
R8丝(314) 麻(229) 葛(484) 布衣(128) 绵(317)
R9朝服(67) 祭服(19) 丧服(140) 戎服(9) 法服(37)
R10深衣(17) 缁衣(18) 素衣(5) 朱衣(18) 青衣(22)

补充搜索

总匹配行数:约7000行(去重前)

Step 4: 重点sed提取

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. 全书65578行,服饰内容以九锡衮冕、冕服郊祀礼制、舆服僭越、丧服经传、冠服等级、赐物制度为六大主线
  2. 行15284/17602/18155/21642/53202/55847为七篇九锡文,"衮冕之服赤舄副焉"格式统一
  3. 行9642东平王苍南北郊冕服议为东汉冕服制度核心
  4. 行28338"魏明帝疑三公衮冕似天子减其采章"为冕服改革关键
  5. 行12660崔寔《政论》为汉代最系统服饰僭越批判
  6. 行64052后周服制为全书最完整的冕服等级体系
  7. 行28335幅巾为雅/裁缣帛为帢为汉魏冠服变革关键
  8. 行44251刘宋六级服制为南朝最完整服制
  9. 丧服文献极多(140行),为六朝礼学核心
  10. 女性妆饰以行18214曹植《洛神赋》为文学巅峰

Step 5: 噪音过滤

噪音类别

有效服饰段落估计:约350段

Step 6: 保存三份文件


关键发现

  1. 九锡衮冕为全书最系统的服饰文献——七篇九锡文格式统一,"衮冕之服赤舄副焉"始终居第二等赐物
  2. 冕服制度为礼学焦点——东平王苍议、皇太子冕服议、衮服议等多篇专论
  3. 后周服制为全书最完整冕服体系——行64052详列六级服制,自天子至九品
  4. 幅巾与帢为汉魏冠服变革标志——从"幅巾为雅"到"裁缣帛为帢"
  5. 崔寔《政论》为最系统僭越批判——婢妾文绣、商贾鬻僭服
  6. 丧服为六朝礼学核心——140行匹配,远超其他服制词汇
  7. 曹植《洛神赋》为女性服饰文学巅峰——罗衣、瑶碧华琚、金翠首饰、雾绡轻裾

关键踩坑记录


文件大小


审核结果

原文均从grep -n提取,有明确行号对应。《全上古三代秦汉三国六朝文》为清严可均辑65578行文总集,服饰内容以九锡衮冕、冕服郊祀礼制、舆服僭越、丧服经传、冠服等级、赐物制度为六大主线,为文总集中服饰内容最丰富者。已据实整理,未灌水凑字。