《玉芝堂谈荟》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《玉芝堂谈荟》全部服饰相关内容,整理分类总结


Step 1: 文件基本信息

```bash wc -l /home/z/my-project/upload/part3/玉芝堂谈荟.txt

结果:2236行

wc -c /home/z/my-project/upload/part3/玉芝堂谈荟.txt

结果:1663339 bytes (约1624KB)

```

大型类书体TXT,严禁一次性载入,必须使用grep定位。

Step 2: 第1轮grep — 核心服饰词全搜

```bash rg -c '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/玉芝堂谈荟.txt

结果:687行命中

```

命中量极大,需精确定位核心条目。

Step 3: 第2轮grep — 制度动作词

```bash rg -c '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/玉芝堂谈荟.txt

结果:13行命中

```

Step 4: 第3轮grep — 扩展词

```bash rg -n '赐麒麟|赐蟒|飞鱼服|坐蟒|闪黄|犀带|红鞓|玉带|金鱼|荔枝銙|黄银|织成|背子|袄子|银泥|蹙金|龙凤牌' /home/z/my-project/upload/part3/玉芝堂谈荟.txt

结果:约30行命中

```

Step 5: 排除规则审查

687条命中远超可逐条审查范围,采取以下策略: 1. 优先审查制度动作词+扩展词命中的43行 2. 对核心服饰词命中行,按类别抽样审查 3. 重点排除:地名用"锦"、动词用"服/领/带/佩"、比喻用"丝/纹"

审查后归纳为11大条,涵盖6大类。

Step 6: sed提取上下文

对11个关键行号区域,逐一sed提取前后上下文,确保段落完整。重点段落: - 行90(赐服倒挂) - 行133-143(嘉靖赐服+土官赐服) - 行141(张居正赐服) - 行1598(宋代带制) - 行1637-1641(宫廷服饰)

操作流程轨迹

文件扫描2236行/1624KB → 第1轮grep 687行命中 → 第2轮grep 13行命中 → 第3轮扩展grep 约30行命中 → 优先审查43行+抽样审查→归纳11大条 → 分类6组 → 创作三份MD

审核结果