《文编》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《文编》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/文苑英华/原文提取.md
读取 文总集output/文苑英华/总结.md
读取 文总集output/文苑英华/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/文编.txt 不存在
→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/集藏/文总集/文编.md
→ 保存为 /home/z/my-project/upload/文总集/文总集/文编.txt
wc -l → 2902行,2.3MB
mkdir -p 文总集output/文编/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(207) 裳(21) 裘(18) 冠(81) 冕(27) | |
| R2 | 袍(2) 褐(12) 裙(2) 衫(2) 襦(3) | |
| R3 | 绶(8) 佩(21) 笏(12) 履(62) 舄(7) | |
| R4 | 帻(0) 弁(7) 铠(2) 甲(140) 兜鍪(0) | |
| R5 | 帛(48) 绢(9) 缟(6) 纱(1) 锦(20) | |
| R6 | 绣(20) 黼(11) 黻(7) 衮(8) 章服(3) | |
| R7 | 带(73) 袂(2) 襟(8) 袖(8) 衽(5) | |
| R8 | 丝(28) 麻(32) 葛(34) 布衣(40) 绵(7) | |
| R9 | 朝服(3) 祭服(1) 丧服(6) 戎服(3) 法服(3) | |
| R10 | 深衣(1) 缁衣(0) 素衣(0) 朱衣(2) 青衣(0) |
总匹配行数:约780行(去重前)
Step 4: grep -n精确搜索
对以下关键词执行grep -n提取行号与上下文:
- 衮冕(5) 黼黻(6) 金紫(12) 佩玉(6) 端冕(1)
- 绯衣(7) 布衣(40) 冠带(12) 章服(3) 通天冠(1)
- 南冠(1) 端冕(1) 垂绅(1) 绣衣(1) 冬裘(1)
关键发现:
- 《文编》服饰内容集中于先秦两汉经典文献(左传、国语、贾谊治安策、荀子等)
- 碑志文中赐服记录丰富:赐绯衣银鱼5次、赐金紫3次、赐通天御带1次
- 贾谊《治安策》关于服饰僭越的批判是全书最集中的服饰思想
- 衮冕出现5次,均为礼制或荣誉性用法
- "布衣"出现40次,含义从服饰延伸至身份、品德
Step 5: 噪音过滤
噪音类别:
- "衣"207行中约70%为"衣"作动词(衣之)或非服饰用法(衣钵、衣食等)
- "甲"140行中约70%为天干"甲子/甲乙"
- "履"62行中约40%为"履行/履历"
- "带"73行中约30%为"地带/连带"
- "章"未统计(90%以上为"文章/章句")
- "布"40行中约15%为"布告/分布"
有效服饰段落估计:约40-50段
Step 6: 保存三份文件
- 文总集output/文编/原文提取.md
- 文总集output/文编/总结.md
- 文总集output/文编/日志.md(本文件)
关键发现
- 经典文献为核心载体:文编取周迄宋之文,先秦两汉文献中服饰论述最为丰富
- 臧哀伯谏为全书最完整的礼服制度清单,衮冕黻珽带裳幅舄衡紞纮綖+火龙黼黻
- 贾谊治安策关于服饰僭越的批判最为激烈:"帝衣皁绨而富民墙屋被文绣"
- 苏轼礼论提出"寛衣博带佩玉履舄所以回翔容与"——服饰约束行为的理论
- 碑志文赐服:赐绯衣银鱼为宋代中级荣誉赐服,出现频率最高(5次)
- 冠带化夷:《后汉书》论赞"制衣裳备文物加玺绂之绶"与《国语》"弃衮冕而南冠"互为正反
- 垂衣裳而治:出现2次,均为"无为而治"之义
关键踩坑记录
- 输入文件不存在于指定路径,需从殆知阁GitHub仓库下载
- 殆知阁数据格式为.md而非.txt,下载后直接使用
- 文编全文无卷号行号标记,所有文本混排,需靠内容判断出处
- "衣"出现207行但大部分为非服饰用法,需逐行鉴别
- "甲"140行中铠甲含义极少,绝大部分为天干
- 文编为文学总集,服饰内容以论述礼制哲学为主,制度细节较少
- 部分古文有异体字/通假字,如"寛"通"宽","防"通"廉"
文件大小
- 原文提取.md:约9KB
- 总结.md:约7KB
- 日志.md:约3KB
审核结果
原文均从grep -n提取,有明确行号对应。由于文编为文学总集,服饰内容以经典文献中的礼制论述为主,制度性记录较少,已据实整理。