《溪山余话》服饰内容提取 — 操作日志
日期:2026-03-04 任务:提取《溪山余话》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/溪山余话.txt
结果:35行,10502字节(约10KB),小型文件
```
Step 2: 第1轮 grep — 核心服饰词
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/溪山余话.txt
结果:9行命中
命中行号:3, 5, 11, 13, 17, 19, 21, 23, 31
```
Step 3: 第2轮 grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/溪山余话.txt
结果:0行命中
```
Step 4: 第3轮 grep — 组合扩展词
```bash rg -n '蟒衣|飞鱼服|斗牛服|麒麟服|蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛|三品已上服紫|五品已上服绯|文官一品仙鹤|武官一品狮子|赐鱼袋|佩鱼|金银鱼袋|大裘而冕|衮冕|鷩冕|毳冕|絺冕|玄冕|软脚|硬脚|展角|交角|乌纱' /home/z/my-project/upload/part3/溪山余话.txt
结果:0行命中
```
Step 5: 排除审查
逐条审查9行命中:
| 行号 | 匹配词 | 语境 | 判定 |
|---|---|---|---|
| 3 | 衣、冠 | "蓑衣笋箨冠"隐士服饰 | ✅保留 |
| 5 | 衣冠、公服 | 谒祠堂具衣冠;塑像公服 | ✅保留 |
| 11 | 衣、绮 | 衣破损、更衣、赐绮 | ✅保留 |
| 13 | 盔、带 | "红盔将军""带刀" | 盔✅保留;带刀❌排除(动词) |
| 17 | 衣 | "布衣"代指平民 | ✅保留 |
| 19 | 罗 | "罗仲素"人名 | ❌排除(姓氏) |
| 21 | (需核实) | 无明确服饰语境 | ❌排除 |
| 23 | 冠、带、帽、衣 | 冠带、帽、羽衣 | ✅保留 |
| 31 | 绮、罗 | "绮罗香泽之态"文学意象 | ✅保留 |
有效命中:7条(排除2条误命中)
Step 6: sed 上下文提取
因文件仅35行/10KB,无需sed分段提取,直接阅读全文后摘录服饰相关行。
Step 7: 分类与输出
按日常服饰、朝堂服饰、军事服饰、赐予与衣料四类整理,产出三份MD。
操作流程轨迹
文件确认(35行/10KB) → 第1轮grep核心词(9行命中) → 第2轮grep制度词(0命中)
→ 第3轮grep扩展词(0命中) → 排除审查(排除2条误命中,保留7条有效)
→ 分类整理 → 产出3MD