《独醒杂志》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《独醒杂志》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/part3/独醒杂志.txt(320行,115473字节)
Step 1: 文件信息确认
```bash wc -l -c /home/z/my-project/upload/part3/独醒杂志.txt
结果:320行,115473字节
```
Step 2: 第1轮grep — 核心服饰词全搜
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 独醒杂志.txt
结果:约45行命中(含大量误命中需审查)
```
Step 3: 误命中审查与排除
- 行34:"龙带晚烟" → 诗句非服饰 → 排除
- 行43:"紫磨黄金" → 非服饰 → 排除
- 行174:"绢画番国士马" → 非服饰 → 排除
- 行242:"蚕食旁近" → 比喻非蚕桑 → 排除
- 行252:"受墨如初" → 砚台非服饰 → 排除
- 行299:"不解衣而涉" → 衣在服饰语境 → 保留
Step 4: 第2轮grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 独醒杂志.txt
结果:1行命中
行246:"张邦昌僭号" → 僭号=僭越称帝 → 保留
```
Step 5: 第3轮grep — 组合扩展词
```bash rg -n '蚕|桑|茧|缫|织|纺|衮冕|鷩冕|毳冕|絺冕|玄冕' 独醒杂志.txt
结果:行242"蚕食旁近" → 比喻 → 排除
本轮无新增有效服饰命中
```
Step 6: sed上下文提取
对18个有效命中行号执行sed提取上下文。
Step 7: 分类与输出
有效服饰命中:约18条(中等丰富度) 按6类整理:朝堂赐服/冠服制度/日常人物/丧葬忠义/服饰材料/社会变迁
操作流程轨迹
文件确认(320行/115KB) → 第1轮核心词grep(~45行命中) → 误命中审查排除(~27条排除)
→ 第2轮制度词grep(1行命中) → 第3轮扩展词grep(0新增)
→ sed上下文提取(18个片段) → 分类归纳(6类18条) → 三MD输出
审核结果
- 原文验证:✅ grep行号对应
- 误命排除:✅ 已排除"龙带晚烟""蚕食"等
- 分类合理:✅ 符合宋代笔记实际分布