《古文观止》服饰内容提取 · 工作日志

时间:2026-03-05

任务:提取《古文观止》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

```

读取 文总集output/古文辞类纂/原文提取.md

读取 文总集output/古文辞类纂/总结.md

读取 文总集output/古文辞类纂/日志.md

→ 确认三份MD输出格式

```

Step 2: 确认输入文件

```

输入文件路径 /home/z/my-project/upload/文总集/文总集/古文观止.txt 不存在

→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/古文观止.md(data分支)

→ 保存为 /home/z/my-project/upload/文总集/文总集/古文观止.txt

wc -l → 1953行,411591字节

mkdir -p 文总集output/古文观止/ → 创建输出目录

```

Step 3: 多轮grep搜索(10轮50词)

轮次关键词及匹配行数
R1衣(63) 裳(4) 裘(7) 冠(29) 冕(3)
R2袍(0) 褐(2) 裙(0) 衫(0) 襦(2)
R3绶(1) 佩(3) 笏(2) 履(14) 舄(3) 靴(1)
R4帻(0) 弁(1) 铠(0) 甲(19) 兜鍪(0) 胄(4)
R5帛(8) 绢(0) 缟(4) 纱(0) 锦(14) 绮(1)
R6绣(5) 黼(1) 黻(1) 衮(3) 章服(0) 袞(0)
R7带(13) 襟(6) 袖(7) 衽(2) 袵(0) 绅(6)
R8丝(11) 麻(4) 葛(11) 布衣(13) 绵(2) 纩(1)
R9朝服(3) 祭服(2) 丧服(0) 戎服(0) 法服(0) 命服(0)
R10深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0) 赐衣(0)

总匹配行数:约235行(去重前,含大量非服饰用法)

Step 4: 补充搜索与grep -n精确提取

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. 全书1953行,服饰内容中等丰富,集中在经典名篇
  2. 臧哀伯谏(行325)为全书冕服制度最完整段落
  3. 苏秦故事(行665-666)为服饰对比最戏剧化段落
  4. "布衣"凡13见,全部有效,是最高频服饰词汇
  5. 楚灵王皮冠翠被豹舄(行493)为全书最奢华服饰描写
  6. 《古文观止》无辞赋类选文(相比《古文辞类纂》),故缺少华丽冕服铺陈

Step 5: 噪音过滤

噪音类别

有效服饰段落估计:约30段,含服饰提及约70处

Step 6: 保存三份文件


关键发现

  1. 服饰内容中等丰富:全书1953行,有效服饰段落约30段
  2. 《左传》篇为冕服制度核心:臧哀伯"衮冕黻珽带裳幅舄衡紞纮綖"为全书最完整制度记载
  3. 苏秦服饰对比最戏剧化:黑貂裘敝→锦绣千纯,服饰即命运
  4. "布衣"为最高频有效服饰词:13见,含义从服饰延伸至身份政治
  5. 华夷之辨贯穿始终:冠带/被发/旃裘对立从左传至宋文
  6. 《古文观止》无辞赋类选文,故缺少班固、司马相如等华丽冕服铺陈
  7. 冠服品级讽刺为时文特色:峨大冠拖长绅、金玉其外败絮其中

关键踩坑记录


文件大小


审核结果

原文均从grep -n提取,有明确行号对应。《古文观止》为清代最流行的古文入门选本,服饰内容中等丰富,集中在经典名篇中的制度论述与叙事对比,绝少铺陈虚饰。已据实整理,未灌水凑字。