《古文集成》服饰内容提取 · 工作日志

时间:2026-03-05

任务:提取《古文集成》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

```

读取 文总集output/古文观止/原文提取.md

读取 文总集output/古文观止/总结.md

读取 文总集output/古文观止/日志.md

→ 确认三份MD输出格式

```

Step 2: 确认输入文件

```

输入文件路径 /home/z/my-project/upload/文总集/文总集/古文集成.txt 不存在

→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/古文集成.md(data分支)

→ 保存为 /home/z/my-project/upload/文总集/文总集/古文集成.txt

wc -l → 1698行,1024632字节

mkdir -p 文总集output/古文集成/ → 创建输出目录

```

Step 3: 多轮grep搜索(10轮50词)

轮次关键词及匹配行数
R1衣(83) 裳(13) 裘(14) 冠(52) 冕(15)
R2袍(0) 褐(6) 裙(2) 衫(0) 襦(1)
R3绶(4) 佩(10) 笏(2) 履(40) 舄(6) 靴(0)
R4帻(0) 弁(3) 铠(0) 甲(49) 兜鍪(0) 胄(10)
R5帛(20) 绢(1) 缟(4) 纱(1) 锦(12) 绮(6)
R6绣(2) 黼(4) 黻(2) 衮(6) 章服(0) 袞(0)
R7带(21) 襟(6) 袖(5) 衽(1) 袵(3) 绅(10)
R8丝(13) 麻(9) 葛(19) 布衣(14) 绵(10) 纩(2)
R9朝服(0) 祭服(0) 丧服(0) 戎服(0) 法服(2) 命服(0)
R10深衣(1) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0) 赐衣(1)

总匹配行数:约310行(去重前,含大量非服饰用法)

Step 4: 补充搜索与grep -n精确提取

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. 全书1698行,服饰内容中等丰富,集中在唐宋古文与箴铭
  2. 胡铨上高宗封事(行1258)为华夷服饰之辨最激烈段落
  3. "布衣"凡14见,全部有效,是最高频服饰词汇
  4. 韩愈原道"夏葛而冬裘"与谏迎佛骨表"法服"为经典论述
  5. 箴铭中"正衣冠"之训出现多次
  6. 欧阳修昼锦堂记"桓圭衮冕""垂绅正笏"为品级论述代表

Step 5: 噪音过滤

噪音类别

有效服饰段落估计:约25段,含服饰提及约65处

Step 6: 保存三份文件


关键发现

  1. 华夷服饰之辨为全书最核心主题:胡铨封事"裂冠毁冕""被发左衽"为最激烈论述
  2. 布衣为最高频有效服饰词:14见,含义从服饰延伸至身份政治
  3. 冕服描写服务于政治论述:桓圭衮冕、垂绅正笏为德重于服
  4. 箴铭多言正衣冠:为儒家修身之始
  5. 夏葛冬裘为常理论证之器:韩愈原道以之喻华夷
  6. 先王教化以衣冠为本:曾巩论"与之为衣冠饮食"
  7. 全书无辞赋类选文,缺少华丽冕服铺陈

关键踩坑记录


文件大小


审核结果

原文均从grep -n提取,有明确行号对应。《古文集成》为南宋古文选本,服饰内容中等丰富,华夷服饰之辨(胡铨封事)为全书最突出特色,箴铭"正衣冠"之训多次出现。已据实整理,未灌水凑字。