国朝画徵录

《国朝画徵录》服饰内容提取 · 操作日志

时间:2026-03-04
任务:提取《国朝画徵录》全部服饰相关内容
输入文件:/home/z/my-project/upload/绘画/绘画/国朝画徵录.txt
输出文件夹:/home/z/my-project/upload/绘画output/国朝画徵录/


操作流程

Step 1: 文件基本信息

wc -l 国朝画徵录.txt
→ 1156行

Step 2: 第一轮grep — 核心词(25词)

bash
grep -n '衣\|裳\|裘\|冠\|冕\|弁\|帻\|巾\|帽\|履\|舄\|靴\|鞋\|袜\|带\|佩\|绶\|笏\|袍\|襦\|裙\|衫\|袂\|褐\|衮' 国朝画徵录.txt

命中约200+行,噪音极高:

有效命中:衣纹3处、布衣(身份)15处、制裘1处、僧帽1处、儒衣1处、典衣1处、衣钵1处、髡发1处、隐于缁1处

Step 3: 第二轮grep — 扩展词(18词)

bash
grep -n '锦\|绮\|绢\|帛\|丝\|绸\|缎\|绫\|罗\|纱\|缟\|缁\|素\|布\|葛\|麻\|毡\|绒' 国朝画徵录.txt

命中约200+行,噪音极高:

有效命中:隐于缁1处

Step 4: 第三轮grep — 制度词(14词)

bash
grep -n '服色\|舆服\|冠服\|章服\|赐服\|赐紫\|赐绯\|品服\|朝服\|祭服\|丧服\|常服\|公服\|吉服' 国朝画徵录.txt

命中1行:

注意:"赐紫衣"中"赐紫"与"衣"组合,grep以"赐紫"命中

Step 5: 第四轮grep — 装饰词(14词)

bash
grep -n '纹\|绣\|织\|染\|染色\|图案\|龙\|凤\|花卉\|补子\|金带\|玉带\|鱼袋\|幞头' 国朝画徵录.txt

命中约200+行,噪音极高:

有效命中:衣纹3处(已在第一轮计入)

Step 6: 第五轮grep — 动作词(8词)

bash
grep -n '赐\|服\|穿\|戴\|着\|披\|束\|加元服' 国朝画徵录.txt

命中约300行,噪音极高:

有效命中:赐紫衣1处(已在第三轮计入)

Step 7: sed提取上下文

对10处有效命中逐条提取前后5行上下文:

sed -n '113,119p' → 丁元公布衣+陈洪绶衣纹
sed -n '145,149p' → 万年少儒衣僧帽
sed -n '443,447p' → 周兼衣纹
sed -n '506,512p' → 王原祁制裘
sed -n '662,666p' → 髡残受衣钵
sed -n '703,707p' → 陈书典衣鬻饰
sed -n '807,812p' → 赵甸隐于缁
sed -n '819,823p' → 王树壳衣纹
sed -n '1103,1107p' → 明中赐紫衣
sed -n '8,12p' → 金针黹

Step 8: 噪音过滤

排除以下噪音类别:


关键发现

  1. 本书服饰信息极稀:1156行中有效服饰信息仅10条,占比不足1%
  2. 绘画类书籍特殊噪音:绢、素、缣、绡等全部为画材载体;衣纹为画法术语;渲染、设色为技法术语,与服饰无关
  3. 最有价值条目:"儒衣僧帽"反映清初遗民服饰策略,"赐紫衣"为清代佛教赐服制度实证
  4. 布衣一词高频但无服饰价值:作为平民代称在画家传记中极常见

审核结果

全部通过 ✅ — 原文均从TXT文件grep提取,有明确行号对应。噪音已严格过滤,不强行凑合。