《研北杂志》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《研北杂志》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/part3/研北杂志.txt(848行,99KB)


Step 1: 文件信息确认

```bash wc -l -c /home/z/my-project/upload/part3/研北杂志.txt

结果:848行,99316字节

```

Step 2: 第1轮grep — 核心服饰词

```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/研北杂志.txt

结果:60+行命中

```

Step 3: 第2轮grep — 制度动作词

```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/研北杂志.txt

结果:3行命中(僭伪相关,非服饰制度)

```

Step 4: 第3轮grep — 组合扩展词

```bash rg -n '蚕|桑|茧|缫|织|纺|绸|缂丝|折帛|和买|市舶|绢价|匹帛|蟒衣|飞鱼服|斗牛服|麒麟服|软脚|硬脚|展角|交角|乌纱|金银鱼袋|佩鱼|大裘|衮冕|鷩冕|毳冕|絺冕|玄冕' /home/z/my-project/upload/part3/研北杂志.txt

结果:6行命中,多为非服饰语境(茧纸、织绢纱等)

```

Step 5: 误命中排除审查

排除以下误命中: - "衣冠"代指士大夫(行254等) - "冠盖"代指达官(行180) - "布衣"代指平民(行771) - "人履冰上"(行88):行走义 - "脱帽"(行539):指墨管 - "绸缪"(行198):非丝织品 - "茧纸"(行258/342):非丝帛 - "织绢纱为业"(行645):织为职业描述

有效命中:约12条

Step 6: 生成三份MD


操作流程轨迹

文件确认(848行/99KB) → 第1轮grep(60+行) → 第2轮grep(3行) → 第3轮grep(6行) → 误命中排除(约48条排除) → 有效命中12条 → 分类整理 → 生成3份MD