《滹南遗老集引》服饰内容提取 — 操作日志
日期:2026-03-04 任务:提取《滹南遗老集引》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/滹南遗老集引.txt
结果:3079行,489864字节(约490KB),大型文件
```
Step 2: 第1轮 grep — 核心服饰词
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/滹南遗老集引.txt | head -60
结果:约20行命中(大量非服饰语境)
关键行号:2, 5, 219, 235, 237, 255, 324, 446, 564, 650, 668, 1077, 1167, 2058, 2783
```
Step 3: 第2轮 grep — 制度词
```bash rg -n '丧服|斩衰|齐衰|大功|小功|缌麻|冠礼|笄礼|冕服|衮服|赐服|加冠|释服|品色|服色' /home/z/my-project/upload/part3/滹南遗老集引.txt
结果:6行命中
行235: 丧服、斩衰、齐衰、大功、小功、缌麻(核心!)
行237: 小功
行257: 丧服
行650: 齐衰
行1077: 服色(易服色)
行2783: 法服、赐
```
Step 4: 第3轮 grep — 按需扩展
前两轮已覆盖主要服饰内容。第三轮无需额外搜索。
Step 5: 排除审查
| 行号 | 匹配词 | 语境 | 判定 |
|---|---|---|---|
| 2 | 佩剑 | "左右佩剑"=比喻左右两种意见 | ❌排除 |
| 5 | 白衣 | "由白衣入翰林"=平民身份 | ❌排除 |
| 2058 | 冠冕 | "百王之冠冕"=比喻最优秀者 | ❌排除 |
| 其余 | — | — | ✅保留 |
有效命中:13条
Step 6: sed 关键段落提取
bash
sed -n '235,235p' 滹南遗老集引.txt # 丧服制度全段
sed -n '219,219p' 滹南遗老集引.txt # 着冕持干而舞
sed -n '2783,2783p' 滹南遗老集引.txt # 法服一袭
操作流程轨迹
文件确认(3079行/490KB) → 第1轮grep核心词(约20行命中) → 第2轮grep制度词(6行命中)
→ 排除审查(排除3条误命中,保留13条有效)
→ 分类整理 → 产出3MD