《齐东野语》服饰内容提取 · 操作日志
时间:2026-03-05 任务:提取《齐东野语》全部服饰相关内容,整理分类总结 输入文件:/home/z/my-project/upload/part4/齐东野语.txt(479,309字节,1,285行)
操作流程
Step 1: 文件预检
wc -l 齐东野语.txt → 1285行
wc -c 齐东野语.txt → 479,309字节(约480KB,<500KB,可分批处理)
Step 2: 第1轮grep——核心服饰词全搜
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|……' 齐东野语.txt
→ 命中354行
命中量较大,但大量为"衣"字的非服饰用法(如"衣冠"代指士大夫、"衣钵"传法等),需逐条审查。
Step 3: 第2轮grep——制度动作词
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠|黄袍|衣冠' 齐东野语.txt
→ 命中22行
Step 4: 第3轮grep——组合扩展词
rg -n '蜀锦|灯笼锦|绵袄|大裘|羽氅|角巾|竹冠|练衣|芒鞋|野服|黄冠|红袍|红半袖|金紫|幞头|红巾|朝天髻|懒梳髻|首饰|珠冠|银绢|彩缎|丝绫|线子罗|红绢|浙绢|黄绢|鸾鹊绫|象轴|金花绫|方空|方目纱|轻绡|纨素' 齐东野语.txt
→ 命中21行
Step 5: 逐条审查与上下文提取
对Step 2-4命中的所有行,按排除规则表审查:
| 关键词 | 误命中文例 | 处理 |
|---|---|---|
| 衣 | "衣钵"(传法) | 保留——含"词科衣钵"可佐证学统 |
| 衣 | "衣冠"(代指士大夫) | 保留——"衣冠盛族""衣冠易服"含服饰制度信息 |
| 衣 | "衣金紫"(穿金紫服) | 保留——描述服色 |
| 带 | "带领""地带" | 排除 |
| 带 | "玉带""腰带" | 保留 |
| 佩 | "钦佩""敬佩" | 排除 |
| 佩 | "佩鱼""解所佩鱼" | 保留 |
| 服 | "服从""服丧" | 排除非服饰义 |
| 服 | "成服""素服""野服" | 保留 |
| 冠 | "冠军""冠绝" | 排除 |
| 冠 | "竹冠""黄冠""峨冠" | 保留 |
| 帛 | "币帛""金帛" | 保留——丝帛制度 |
| 锦 | "锦被""锦书" | 保留"锦袍"等服饰义,"锦被"视语境保留 |
| 罗 | "罗列""星罗棋布" | 排除 |
| 罗 | "线子罗""嫌罗不着爱轻容" | 保留——丝织品 |
| 环 | "环石柱" | 排除——建筑义 |
| 麻 | "麻制"=翰林诏书 | 排除 |
Step 6: 分类整理
将审查通过的内容分为10大类: 1. 织物考证(轻容、方空) 2. 帝王即位服(黄袍) 3. 品级服色(赐玉带、佩鱼、衣金紫、绿衫) 4. 冠巾首服(幞头、峨冠、角巾、竹冠、幅巾、方巾) 5. 女服首饰(朝天髻、懒梳髻、三十六髻;牡丹会衣花配色) 6. 戎服军服(红袍、红半袖) 7. 衣料贡赋(蜀灯笼锦、岁币绢帛、彩缎绫罗) 8. 丧祭礼服(成服、素服、端衣玄裳、赤舄绣裳) 9. 身份政治(衣冠易服、僭拟、布衣、黄冠、汉衣冠) 10. 其他(笏、珠冠等)
Step 7: 产出三份文件
- 总结.md(本文件的同级文件,分类总结)
- 日志.md(本文件)
- 原文提取.md(含完整原文及行号)
关键发现
- "轻容方空"条为全书最具学术价值的服饰考证:对轻容纱、方空纱(方目纱)之名物溯源,征引《汉元帝纪》《释名》《元丰九域志》等,在宋代笔记中罕见
- 黄袍在南宋政治中的特殊地位:两次黄袍事件(宁宗即位/济王被迫),一合法一僭越,对比鲜明
- 优伶发髻讽刺权臣:朝天髻(蔡京)、懒梳髻(郑居中)、三十六髻(童贯),为宋代服饰政治讽刺的珍品
- 牡丹会衣花配色:白花紫衣、紫花鹅黄、黄花红衣,反映南宋士族服饰色彩审美
- 岁币绢帛的详细记录:红绢与浙绢的区分、彩缎中各种绫罗的名目,为宋代丝织品贸易的重要史料
- 服饰作为政治符号:幞头脱露红巾(官贼一体)、峨冠大袖(道学讽刺)、衣冠易服(伪学之禁)
- 蜀灯笼锦事件:反映南宋宫中索取地方特产的弊政及近习中伤的政治生态
关键踩坑记录
- "衣冠"在本书中大量出现,但多为代指"士大夫"或"仕宦阶层",需逐条判断是否含实质服饰信息
- "衣钵"出现2次,均为"词科衣钵传之",非服饰义,但作为学术用语保留
- "金紫"出现4次,需区分"衣金紫"(穿金紫服)与"金紫光禄大夫"(官名)
- "黄冠"出现3次,均为"道士"代称,非具体首服描写,但保留因含制度信息
- "笏"出现4次,为朝会礼仪器物,与冠服制度相关,保留
- 文本中OCR讹误较多,如"纟徙"应为"纚",""应为"縠"等
- 部分条目跨数行,需用sed提取上下文确保完整