《古文关键》服饰内容提取 · 工作日志

时间:2026-03-05

任务:提取《古文关键》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

```

读取 文总集output/文章轨范/原文提取.md

读取 文总集output/文章轨范/总结.md

读取 文总集output/文章轨范/日志.md

→ 确认三份MD输出格式

```

Step 2: 确认输入文件

```

输入文件路径 /home/z/my-project/upload/文总集/文总集/古文关键.txt 不存在

→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/古文关键.md

→ 保存为 /home/z/my-project/upload/文总集/文总集/古文关键.txt

wc -l → 301行,143KB

mkdir -p 文总集output/古文关键/ → 创建输出目录

```

Step 3: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(5) 裳(0) 裘(2) 冠(4) 冕(0)
R2袍(0) 褐(0) 裙(0) 衫(0) 襦(0)
R3绶(0) 佩(0) 笏(0) 履(2) 舄(0)
R4帻(0) 弁(0) 铠(0) 甲(4) 兜鍪(0)
R5帛(2) 绢(0) 缟(0) 纱(0) 锦(0)
R6绣(0) 黼(0) 黻(0) 衮(0) 章服(0)
R7带(1) 袂(0) 襟(0) 袖(0) 衽(1)
R8丝(3) 麻(2) 葛(2) 布衣(3) 绵(1)
R9朝服(0) 祭服(0) 丧服(0) 戎服(0) 法服(0)
R10深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0)

总匹配行数:约34行(去重前)

Step 4: 补充搜索与grep -n精确提取

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. 《古文关键》全书仅301行,服饰内容极为稀少
  2. 韩愈《原道》为服饰内容最集中的单篇(行126),含5处服饰提及
  3. 欧阳修《本论》"右袵而冠带""被髪于伊川"为华夷之辨核心段落
  4. 无衮冕、黼黻、章服、朝服、祭服等制度性词汇
  5. R2全部为0(袍褐裙衫襦),R3除履外为0,R6全部为0

Step 5: 噪音过滤

噪音类别

有效服饰段落估计:约9段,含服饰提及约18处

Step 6: 保存三份文件


关键发现

  1. 服饰内容极少:全书301行六十余篇,服饰相关段落仅约9段,无任何制度性记录
  2. 华夷之辨最突出:欧阳修《本论》"右袵而冠带"、韩愈《与孟尚书书》"服左衽"为全书服饰思想核心
  3. 布衣为高频词:出现3次,从服饰延伸至身份、品德
  4. 韩愈《原道》为最集中单篇:含"为之衣""夏葛冬裘""责冬之裘""麻丝""其服丝麻"五处
  5. 无军服制度描写:"被甲荷戈"仅为修辞对比,非制度描述
  6. "屦"为唯一足衣提及:苏辙以制鞋喻立法,属比喻用法

关键踩坑记录


文件大小


审核结果

原文均从grep -n提取,有明确行号对应。《古文关键》为南宋吕祖谦所编古文选本,以论文法度为主,服饰内容极少,均为文学修辞中的零星用法,无制度性记录。已据实整理,未灌水凑字。