《国朝画徵录》服饰内容提取 · 操作日志
时间:2026-03-04
任务:提取《国朝画徵录》全部服饰相关内容
输入文件:/home/z/my-project/upload/绘画/绘画/国朝画徵录.txt
输出文件夹:/home/z/my-project/upload/绘画output/国朝画徵录/
操作流程
Step 1: 文件基本信息
wc -l 国朝画徵录.txt
→ 1156行
Step 2: 第一轮grep — 核心词(25词)
bash
grep -n '衣\|裳\|裘\|冠\|冕\|弁\|帻\|巾\|帽\|履\|舄\|靴\|鞋\|袜\|带\|佩\|绶\|笏\|袍\|襦\|裙\|衫\|袂\|褐\|衮' 国朝画徵录.txt
命中约200+行,噪音极高:
- "衣":大量"布衣"(平民义)、"衣纹"(画法术语)、"衣钵"(佛教传承)、"衣白"(人号)
- "冠":几乎全部为"冠"字的非服饰用法("冠绝""冠冕"为比喻义)
- "裘":"裘孝廉"为人名;"制裘"1处为真实服饰
- "帽":"僧帽"1处为真实服饰
- "冕":"冠冕"为比喻义("冠冕"=首位/典范)
- "带":多为"地带""连带"等非服饰义
- "弁/帻/履/舄/靴/鞋/袜/袍/襦/裙/衫/袂/褐/衮/绶/笏":无有效命中
- "佩":"佩"多为"佩服""钦佩"义,非佩饰
有效命中:衣纹3处、布衣(身份)15处、制裘1处、僧帽1处、儒衣1处、典衣1处、衣钵1处、髡发1处、隐于缁1处
Step 3: 第二轮grep — 扩展词(18词)
bash
grep -n '锦\|绮\|绢\|帛\|丝\|绸\|缎\|绫\|罗\|纱\|缟\|缁\|素\|布\|葛\|麻\|毡\|绒' 国朝画徵录.txt
命中约200+行,噪音极高:
- "绢/素/缣":全部为画材载体("绢素""生绡""尺缣")
- "罗":多为人名(罗牧、罗烜)、地名
- "锦":"濯锦池"为地名
- "缁":"隐于缁"1处为有效(僧服)
- "丝":"丝茧"1处为蚕丝,非服饰
- "布":"布衣"同第一轮,均为身份义;"布以窠石"为布置义
- "纱/绸/缎/绫/帛/缟/葛/麻/毡/绒":无有效服饰命中
有效命中:隐于缁1处
Step 4: 第三轮grep — 制度词(14词)
bash
grep -n '服色\|舆服\|冠服\|章服\|赐服\|赐紫\|赐绯\|品服\|朝服\|祭服\|丧服\|常服\|公服\|吉服' 国朝画徵录.txt
命中1行:
- 第1105行:"赐紫衣" → 有效(佛教赐服制度)
注意:"赐紫衣"中"赐紫"与"衣"组合,grep以"赐紫"命中
Step 5: 第四轮grep — 装饰词(14词)
bash
grep -n '纹\|绣\|织\|染\|染色\|图案\|龙\|凤\|花卉\|补子\|金带\|玉带\|鱼袋\|幞头' 国朝画徵录.txt
命中约200+行,噪音极高:
- "纹":"衣纹"3处为画法术语;其余"纹理""皴纹"等均为绘画技法
- "绣":"朱绣"为人名
- "织":无服饰织造义
- "染":"渲染""烘染"为绘画技法,非染色
- "龙/凤/花卉":均为绘画题材,非服饰纹样
- "补子/金带/玉带/鱼袋/幞头":无命中
有效命中:衣纹3处(已在第一轮计入)
Step 6: 第五轮grep — 动作词(8词)
bash
grep -n '赐\|服\|穿\|戴\|着\|披\|束\|加元服' 国朝画徵录.txt
命中约300行,噪音极高:
- "赐":"赐金""赐诗""赐题""赐号"等为皇帝赏赐,非赐服
- "服":"服阕"(守丧期满)为礼制术语;"佩服"为钦佩义
- "穿/戴/着/披/束":多为"穿着"画衣、"披图""披赏"等非服饰义
- "加元服":无命中
有效命中:赐紫衣1处(已在第三轮计入)
Step 7: sed提取上下文
对10处有效命中逐条提取前后5行上下文:
sed -n '113,119p' → 丁元公布衣+陈洪绶衣纹
sed -n '145,149p' → 万年少儒衣僧帽
sed -n '443,447p' → 周兼衣纹
sed -n '506,512p' → 王原祁制裘
sed -n '662,666p' → 髡残受衣钵
sed -n '703,707p' → 陈书典衣鬻饰
sed -n '807,812p' → 赵甸隐于缁
sed -n '819,823p' → 王树壳衣纹
sed -n '1103,1107p' → 明中赐紫衣
sed -n '8,12p' → 金针黹
Step 8: 噪音过滤
排除以下噪音类别:
- "布衣"×15处:均为平民身份标识,非服饰描述
- "绢/素/缣"×20+处:均为画材载体
- "冠冕"×2处:比喻义
- "轩冕"×1处:比喻义
- "衣钵"×1处:佛教传承信物(保留,因涉及袈裟)
- "衣白"×1处:人号
- "朱绣"×2处:人名
- "渲染/烘染/设色/傅染"×30+处:绘画技法
- "纹"×10+处:除"衣纹"外均为绘画纹理
- "罗"×5+处:人名/地名
- "锦"×1处:地名"濯锦池"
- "裘孝廉"×1处:人名(裘为姓)
关键发现
- 本书服饰信息极稀:1156行中有效服饰信息仅10条,占比不足1%
- 绘画类书籍特殊噪音:绢、素、缣、绡等全部为画材载体;衣纹为画法术语;渲染、设色为技法术语,与服饰无关
- 最有价值条目:"儒衣僧帽"反映清初遗民服饰策略,"赐紫衣"为清代佛教赐服制度实证
- 布衣一词高频但无服饰价值:作为平民代称在画家传记中极常见
审核结果
全部通过 ✅ — 原文均从TXT文件grep提取,有明确行号对应。噪音已严格过滤,不强行凑合。