《辽文萃》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《辽文萃》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/全辽文/原文提取.md
读取 文总集output/全辽文/总结.md
读取 文总集output/全辽文/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件 /tmp/daizhige_data/集藏/文总集/辽文萃.md
wc -l → 1367行,118KB
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(15) 裳(1) 裘(1) 冠(7) 冕(1) | |
| R2 | 袍(0) 褐(0) 裙(0) 衫(0) 襦(0) | |
| R3 | 绶(1) 佩(4) 笏(0) 履(5) 舄(0) | |
| R4 | 帻(0) 弁(0) 铠(0) 甲(15) 兜鍪(0) | |
| R5 | 帛(8) 绢(4) 缟(0) 纱(1) 锦(7) | |
| R6 | 绣(0) 黼(1) 黻(1) 衮(9) 章服(0) | |
| R7 | 带(2) 袂(0) 襟(0) 袖(1) 衽(0) | |
| R8 | 丝(1) 麻(1) 葛(0) 布衣(1) 绵(2) | |
| R9 | 朝服(0) 祭服(0) 丧服(0) 戎服(0) 法服(0) | |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0) |
总匹配行数:约87行(去重前)
Step 4: grep -n精确搜索
对以下关键词执行grep -n提取行号与上下文:
- 册封赐服:车服冠剑印绶(1) 冠诸侯王(1)
- 赐锦衣:锦衣银器(2)
- 衣冠教化:衣冠见毁(2) 衣冠之化(1) 冠冕之绪(1)
- 服饰认同:汉家衣裳(1) 披裘(1) 褫左袵(1) 衣裾(2)
- 礼服:必具礼服(1)
- 布帛织物:布帛短狭(1) 增绢(1) 金帛车服(1)
- 佛教服饰:赐紫(2) 舍衣钵(1) 减衣御(1)
- 契丹生活:绩毛饮湩以为衣食(1)
关键发现:
- "得服汉家衣裳"(行470)为全书最独特的服饰文献,衣裳承载文化认同
- "绩毛饮湩以为衣食"(行670)为契丹部族服饰的写实记录
- "衮"9行均为"特哩衮""详衮"等契丹官名,非衮服义
- "甲"15行中绝大部分为甲子纪年,非铠甲义
Step 5: 噪音过滤
噪音类别:
- "衮"9行全部为契丹官名(特哩衮、详衮、胡都衮、布尔锦等),非衮服
- "甲"15行中约95%为甲子纪年
- "帛"8行中约70%为"金帛""布帛"等外交/经济用语
- "锦"7行中约70%为"布尔锦""锦州"等非服饰用法
- "衣"15行中约50%为"衣食""衣钵""衣御"等非典型服饰用法
- "履"5行中约80%为"履历""履行"等动词用法
有效服饰段落估计:约12段
Step 6: 保存三份文件
- 文总集output/辽文萃/原文提取.md
- 文总集output/辽文萃/总结.md
- 文总集output/辽文萃/日志.md(本文件)
关键发现
- "得服汉家衣裳"为辽文萃最独特的服饰文献,表达服饰与民族认同的深层关系
- 绩毛饮湩为契丹部族服饰的直接记录,毛织品为核心衣料
- 辽文萃篇幅较小(1367行),服饰内容远少于《全辽文》(5004行)
- 布帛质量管理制度(行54)为辽代经济史料中罕见的服饰相关内容
- 辽文萃与《全辽文》为互补关系,辽文萃偏重外交文书,全辽文偏重碑志铭文
文件大小
- 原文提取.md:约8KB
- 总结.md:约7KB
- 日志.md:约3KB