《潜邱劄记》服饰内容提取 — 操作日志

日期:2026-04-19 任务:提取《潜邱劄记》全部服饰相关内容,整理分类总结


Step 1: 文件基本信息

```bash wc -l /home/z/my-project/upload/part3/潜邱劄记.txt

结果:893行 / 341KB

```

Step 2: 第1轮grep — 核心服饰词

```bash rg -c '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|裙|衫|袄|褐|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|帽|靴|鞋|袜|披|氅|褂|领|袖|簪|钗|钏|环|鱼袋|朝服|公服|常服|赐服|弁|盔|胄|缨|纹|深衣...' 潜邱劄记.txt

结果:150行命中

```

Step 3: 第2轮grep — 制度动作词

```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 潜邱劄记.txt

结果:6行命中(冠礼L30、释服L224、僭L837/L867等)

```

Step 4: 第3轮grep — 组合扩展词

```bash rg -n '朝服|公服|丧服|祭服|戎服|衣裳|冠服|衮冕|章服|品服|纱帽|幞头|帻|巾帻|玉带|金带|银带|笏|绶|鱼袋|簪|钗|缨|弁|盔|胄|裙|衫|袄|袍|裘|氅|褂|褐|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|袴|襦|深衣|舄|履|冠礼|衣冠|布衣|锦衣|冠带' 潜邱劄记.txt

结果:约60行命中

```

Step 5: 排除审查

排除项 原因
L4 书目提要"冠"字 非服饰义
L45 "葛荣" 人名
L71 "屦恒满户" 屦为门限义,非足服
L192 "婆罗门" 非服饰
L281 "漆丝织文" 贡物清单,属经济
L440 "衣冠" 士大夫代称
L534 "银" 货币义
L547 "黻" 官服名但上下文为官署
L693 "图章" 非服饰
L743 "五服" 丧服制度,已收录
L779 "衣" 上下文为官职

审查后保留15条有效服饰命中。

Step 6: sed提取关键段落

bash sed -n '167,169p' 潜邱劄记.txt # 舄履靴戎服袴褶 sed -n '468,481p' 潜邱劄记.txt # 丧服翼注 sed -n '641p' 潜邱劄记.txt # 跣韤 sed -n '749p' 潜邱劄记.txt # 帻之屋

Step 7: 整理分类,生成三份文件


操作流程轨迹

文件检查✅(893行/341KB) → 第1轮grep✅(150行) → 第2轮grep✅(6行) → 第3轮扩展✅(60行) → 排除审查✅(排除约45条) → sed提取✅ → 分类整理✅(4类15条) → 3MD保存✅

关键发现

审核结果