《辽文萃》服饰内容提取 · 工作日志

时间:2026-05-09

任务:提取《辽文萃》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

```

读取 文总集output/全辽文/原文提取.md

读取 文总集output/全辽文/总结.md

读取 文总集output/全辽文/日志.md

→ 确认三份MD输出格式

```

Step 2: 确认输入文件

```

输入文件 /tmp/daizhige_data/集藏/文总集/辽文萃.md

wc -l → 1367行,118KB

```

Step 3: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(15) 裳(1) 裘(1) 冠(7) 冕(1)
R2袍(0) 褐(0) 裙(0) 衫(0) 襦(0)
R3绶(1) 佩(4) 笏(0) 履(5) 舄(0)
R4帻(0) 弁(0) 铠(0) 甲(15) 兜鍪(0)
R5帛(8) 绢(4) 缟(0) 纱(1) 锦(7)
R6绣(0) 黼(1) 黻(1) 衮(9) 章服(0)
R7带(2) 袂(0) 襟(0) 袖(1) 衽(0)
R8丝(1) 麻(1) 葛(0) 布衣(1) 绵(2)
R9朝服(0) 祭服(0) 丧服(0) 戎服(0) 法服(0)
R10深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0)

总匹配行数:约87行(去重前)

Step 4: grep -n精确搜索

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. "得服汉家衣裳"(行470)为全书最独特的服饰文献,衣裳承载文化认同
  2. "绩毛饮湩以为衣食"(行670)为契丹部族服饰的写实记录
  3. "衮"9行均为"特哩衮""详衮"等契丹官名,非衮服义
  4. "甲"15行中绝大部分为甲子纪年,非铠甲义

Step 5: 噪音过滤

噪音类别

有效服饰段落估计:约12段

Step 6: 保存三份文件


关键发现

  1. "得服汉家衣裳"为辽文萃最独特的服饰文献,表达服饰与民族认同的深层关系
  2. 绩毛饮湩为契丹部族服饰的直接记录,毛织品为核心衣料
  3. 辽文萃篇幅较小(1367行),服饰内容远少于《全辽文》(5004行)
  4. 布帛质量管理制度(行54)为辽代经济史料中罕见的服饰相关内容
  5. 辽文萃与《全辽文》为互补关系,辽文萃偏重外交文书,全辽文偏重碑志铭文

文件大小