《满清外史》服饰内容提取 — 操作日志
日期:2026-03-04 任务:提取《满清外史》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/满清外史.txt
结果:454行,83339字节(约83KB),中型文件
```
Step 2: 第1轮 grep — 核心服饰词
```bash rg -n '衣|冠|袍|裘|带|佩|巾|帽|靴|鞋|袜|褂|领|袖|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|披|氅|朝服|公服|常服|吉服|丧服|戎服|赐服|蟒衣|补服|弁|盔|胄|缨|纹|黼|黻|法服|燕服|深衣' /home/z/my-project/upload/part3/满清外史.txt
结果:约25行命中(含非服饰语境命中)
关键行号:38, 58, 94, 108, 114, 124, 150, 162, 194, 212, 218, 242, 270, 296, 306, 346, 406, 412, 416
```
Step 3: 第2轮 grep — 制度动作词+清代专项词
```bash rg -n '剃发|易服|衣冠|龙衣|汉服|蟒缎|顶戴|花翎|马褂|朝服|朝珠|旗装|旗袍|发辫|辫发|十不从|男从女不从|赐服|赐紫|赐绯|僭|逾制|品色|冠礼|加冠|黄马褂|翎子|补服' /home/z/my-project/upload/part3/满清外史.txt
结果:9行命中
行102: 十不从(关键!)
行114: 衣冠、剃发
行150: 朝服
行194: 衣冠、汉服
行270: 僭(和珅穿御服)
行346: 龙衣
行406: 衣冠
行412: 蟒缎
```
Step 4: 第3轮 grep — 按需扩展
前两轮已覆盖主要服饰内容,第三轮无需额外扩展搜索。
Step 5: 排除审查
| 行号 | 匹配词 | 语境 | 判定 |
|---|---|---|---|
| 194 | "衣冠" | "衣冠雀起"=人材辈出 | ❌排除(人材义) |
| 260 | "倡优" | "倡优蓄之"=以倡优待之 | ❌排除(比喻义) |
| 其余 | — | — | ✅保留 |
有效命中:21条
Step 6: sed 关键段落提取
bash
sed -n '102,102p' 满清外史.txt # 十不从
sed -n '194,194p' 满清外史.txt # 乾隆穿汉服
sed -n '270,270p' 满清外史.txt # 和珅穿御服
sed -n '346,346p' 满清外史.txt # 织办龙衣
sed -n '412,412p' 满清外史.txt # 蟒缎赐予
操作流程轨迹
文件确认(454行/83KB) → 第1轮grep核心词(约25行命中) → 第2轮grep制度+清代专项(9行命中)
→ 排除审查(排除2条误命中,保留21条有效)
→ 分类整理 → 产出3MD