《元文类》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《元文类》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/元艺圃集/原文提取.md
读取 文总集output/元艺圃集/总结.md
读取 文总集output/元艺圃集/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/元文类.txt 不存在
→ 从殆知阁数据目录复制:/tmp/daizhige_data/集藏/文总集/元文类.md
→ 保存为 /home/z/my-project/upload/文总集/文总集/元文类.txt
wc -l → 3810行
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(207) 裳(27) 裘(23) 冠(131) 冕(26) | |
| R2 | 袍(7) 褐(10) 裙(1) 衫(4) 襦(2) | |
| R3 | 绶(11) 佩(54) 笏(12) 履(84) 舄(5) | |
| R4 | 帻(3) 弁(9) 铠(2) 甲(126) 兜鍪(0) | |
| R5 | 帛(52) 绢(6) 缟(3) 纱(4) 锦(38) | |
| R6 | 绣(18) 黼(11) 黻(8) 衮(32) 章服(2) | |
| R7 | 带(69) 袂(3) 襟(17) 袖(13) 衽(1) | |
| R8 | 丝(42) 麻(24) 葛(21) 布衣(17) 绵(36) | |
| R9 | 朝服(2) 祭服(1) 丧服(3) 戎服(2) 法服(0) | |
| R10 | 深衣(2) 缁衣(2) 素衣(0) 朱衣(1) 青衣(3) |
额外搜索:衮冕(7) 衮服(0) 服色(3) 赐服(1) 冕服(2) 冠带(5) 旒(3) 赐紫(0) 鱼袋(0) 绯(2) 袆(3) 服饰(1) 冠服(4) 服制(4) 衣冠(38) 赐衣(5) 袴(3) 襕(0) 被发(2) 左衽(0) 褐衣(1) 袆(3) 济逊(1) 舆服(3)
总匹配行数:约1200行(去重前)
Step 4: grep -n精确搜索与上下文提取
对以下关键词执行grep -n提取行号与上下文:
- 衮冕制度:衮冕(7行) 冕服(2行) 龙衮(2行) 衮裳赤舄(1行)
- 舆服制度:舆服(3行) 冠服(4行) 服制(4行) 服色(3行)
- 衣冠文明:衣冠(38行→约20行有效) 不易衣冠(2行) 喜衣冠(1行)
- 赐衣赏赐:赐衣(5行) 锦衣(约5行) 衣一袭(2行)
- 济逊衣冠:济逊(1行)
- 衮服赠谥:玄衮赤绂(1行) 黻衮之加(1行) 衮衣(2行) 黼冕桓圭(1行)
- 冠服考辨:冕服挟剑(1行) 冕旒(1行) 冠服之饰(1行)
关键发现:
- 行2978为元代舆服制度总纲,三层结构(因俗旧、择善通用、考古制服)
- 英宗朝衮冕制度为全书最突出的服饰主题,7处衮冕记录全部集中英宗朝
- 行2493"济逊"衣冠为元代独有服饰制度的唯一完整记载
- "衣冠不改"为平宋核心政策(行2016、2161),忽必烈"喜衣冠崇礼让"(行2167)
- 张弘范拒受锦衣玉带请赐剑甲为最著名的服饰典故
Step 5: 噪音过滤
噪音类别:
- "衣"207行中约85%为"衣食""衣钵""衣冠"等非专门服饰用法
- "冠"131行中约75%为"冠军""冠绝"等非服饰用法
- "甲"126行中约70%为天干用法(甲子、甲寅等纪年)
- "绵"36行中约90%为"绵延""绵历"等非服饰用法
- "帛"52行中约85%为"币帛""金帛"等财物泛称
- "带"69行中约85%为"地带""带领"等非服饰用法
- "佩"54行中约80%为"佩服""钦佩"等非服饰用法
- "丝"42行中约90%为"丝竹""游丝"等非服饰用法
- "裘"23行中约70%为"貂裘""裘马"等文学意象
- "衮"32行中约60%为服饰义(衮冕、衮衣、龙衮等),其余为"衮衮"
有效服饰段落估计:约60-80段
Step 6: 保存三份文件
- 文总集output/元文类/原文提取.md
- 文总集output/元文类/总结.md
- 文总集output/元文类/日志.md(本文件)
关键发现
- 舆服制度总纲——行2978"因俗旧、择善通用、考古制服"三层结构,为理解元代服饰政策的核心文献
- 英宗衮冕——7处衮冕全部集中在英宗朝,英宗为元代祭祀礼服制度化的确立者
- 衣冠文明——"衣冠不改"为平宋政策,"喜衣冠崇礼让"为忽必烈接受华夏文明的证据
- 济逊衣冠——行2493为"济逊"制度的唯一完整记载,为元代独有服饰制度
- 赐衣体系——锦衣三袭、锦衣白金宝鞍、衣一袭、赐衣冠构成完整的功臣赏赐体系
关键踩坑记录
- 输入文件不存在于指定路径,从/tmp/daizhige_data/复制
- "衣"207行为全书最高频服饰词,但85%为非服饰用法,噪音极高
- "甲"126行中70%为天干纪年,需仔细过滤
- "衮"32行中约40%为"衮衮"(连续不断义),非服饰
- "济逊"仅1行但为全书最独特的服饰文献,不可遗漏
- 元文类为散文总集(非诗歌),服饰内容以制度文献为主,与诗歌总集的意象化描写形成鲜明对比
- "衣冠"38行中约一半为华夏文明代称而非具体服饰
- 行2978为独立短文(舆服专条),需特别标注
文件大小
- 原文提取.md:约16KB
- 总结.md:约8KB
- 日志.md:约4KB