《官场现行记》服饰内容提取 · 操作记录
时间:2026-04-17 任务:提取《官场现行记》全部服饰相关内容,整理分类总结 输入文件:/home/z/my-project/upload/part2/官场现行记.txt(约2MB)
操作流程
Step 1: 读取参考模板
读取 /home/z/my-project/upload/参考/总结.md(吕氏春秋模板)
读取 /home/z/my-project/upload/参考/日志.md(晋会要模板)
读取 /home/z/my-project/upload/参考/原文提取.md(天工开物模板)
三份模板风格各异: - 总结.md:分类论述+表格+核心思想提炼 - 日志.md:流程记录+关键发现+踩坑记录+审核 - 原文提取.md:按主题分节+行号标注+注释
Step 2: 5轮grep检索
# 轮1-基础服饰词:衣|裳|裘|冠|冕|弁|帽|巾|袍|裙|袂|褐|衫|褂|襦|袴|裤|帔|履|靴|舄|鞋|袜
grep -n ... 官场现行记.txt → 373行
# 轮2-丝织词:锦|绮|帛|绢|绫|罗|缎|绸|纱|缂丝|缯|纨|素(排除"丝",因"丝毫"等噪音过多)
grep -n ... 官场现行记.txt → 121行
# 轮3-等级词:舆服|服色|冠服|章服|法服|朝服|祭服|常服|公服|吉服|丧服|品色|赐紫|赐绯|借紫|借绯
grep -n ... 官场现行记.txt → 8行
# 轮4-配饰词:笏|鱼袋|革带|玉带|金带|银带|幞头|凤冠|步摇|簪|钗|钏|镯|玉佩|霞帔|帔帛|披帛(排除"佩",因"佩服"等噪音)
grep -n ... 官场现行记.txt → 15行
# 轮5-纺织词:绵|布|葛|麻|苎|棉|染|织|绣|纹|黼|黻
grep -n ... 官场现行记.txt → 141行
Step 3: 补充定向grep
由于《官场现行记》是晚清小说,服饰术语与古籍不同,追加针对性搜索:
# 官服术语
grep -n '朝珠|蟒袍|补服|补褂|顶戴|花翎|翎管|顶子|蓝顶|金顶|红顶|顶珠|黄马褂|朝服|公服|吉服|常服|缺衿|缺襟|袍套|紧身' → 150行
# 面料与皮草
grep -n '衣箱|衣料|裁缝|估衣|绸缎|羽缎|哈喇|搭连布|皮袍|狐皮|貂|猞猁|灰鼠|羊皮|皮困秋|京靴|粉底' → 447行
Step 4: sed提取关键上下文
sed -n '628,632p' → 署院装穷描写(核心段落)
sed -n '1431,1435p' → 佐杂太爷穷酸穿着
sed -n '1826,1830p' → 剪辫易服场景
sed -n '1461,1463p' → 朝服/公服换装
sed -n '1272,1275p' → 嫁装首饰
Step 5: 筛选与分类
从总计约700行grep结果中,筛选有效服饰片段(排除纯叙事中"衣"字的虚词用法如"衣锦还乡"的泛指),归纳为6大类:
- 官服等级制度:顶戴/花翎/蟒袍/补服/朝珠/黄马褂
- 日常官场穿着:袍套/马褂/大褂/便衣/行装
- 皮草与面料:貂/猞猁狲/狐/羊/搭连布/哈喇呢/羽缎
- 配饰与首饰:搬指/翎管/金表/金镯/金簪/珍珠头面
- 服饰与社会现象:穿衣攀附/穷官惨状/上任前后变化/剪辫易服
- 服饰礼仪:宽章/换吉服/素褂忌辰/升冠
Step 6: 对抗式审查
逐条核对原文,检查以下问题:
| 审查项 | 结果 |
|---|---|
| 行号是否对应原文 | ✅ 全部通过sed验证 |
| 是否误收非服饰内容 | ✅ 排除"丝毫""佩服"等噪音词 |
| 分类是否合理 | ✅ 6大类覆盖全面 |
| 是否遗漏重要段落 | ⚠️ 发现L1220"翡翠簪子蹬成好几段"应收入,已补 |
| 总结是否有据 | ✅ 每条总结均附原文行号 |
| 文件大小 | ✅ 三篇均≤20KB |
关键发现
- 署院禁奢风潮(L628-659)是全书最精彩的服饰叙事——以穿衣禁令为权力手段,从装穷到被迫让步,层层递进
- 顶子颜色=权力等级:红顶(一二品)>蓝顶(五品)>金顶(七品)>白顶水晶顶(无品级管家)
- 搬指是全书最高频配饰:翡翠搬指从三百两到九百两不等,成为官场奢靡与贪腐的缩影
- 镀金簪→金耳坠(L484):龙珠以此比喻官员上任前后的贪腐变化,是全书最精妙的服饰隐喻
- 黄三溜子穿旧袍套(L642-647):从估衣铺到料烟嘴充翎管,暴露官场投机的荒诞
- 羊皮风潮(L659):杭州城因署院一句"羊皮褂子"而羊皮飞涨,揭示官场话语的经济效应
- 剪辫场景(L1826):蟒袍补褂与和尚头的对比,折射晚清新旧交替的时代困境
关键踩坑记录
- "丝"字噪音极大("丝毫""丝厂"等),round2须排除
- "佩"字噪音大("佩服""钦佩"),round4须排除
- 小说中的服饰术语与古籍截然不同,5轮grep模板偏古典,须追加晚清官场术语
- 《官场现行记》服饰描写多为叙事中的穿插,罕见独立段落,需仔细甄别
- 部分行号跨段(如L1826单行极长),sed提取需注意上下文完整性
审核结果
全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应,分类合理,三篇MD均≤20KB。