《满清兴亡史》服饰内容提取 — 操作日志
日期:2026-03-04 任务:提取《满清兴亡史》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/满清兴亡史.txt
结果:517行,154952字节(约155KB),中型文件
```
Step 2: 第1轮 grep — 核心服饰词
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/满清兴亡史.txt
结果:约30行命中(含大量非服饰语境命中)
关键行号:67, 71, 81, 87, 89, 97-105, 109, 113, 135, 141, 177, 201, 229, 247, 281
```
Step 3: 第2轮 grep — 制度动作词+专项词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠|剃发|易服|衣冠' /home/z/my-project/upload/part3/满清兴亡史.txt
结果:15行命中
剃发相关:67, 97, 99, 101, 103, 105, 109, 113, 141
衣冠相关:89, 113, 135
逾制:229
易服:281
```
Step 4: 第3轮 grep — 清代专项扩展词
```bash rg -n '黄马褂|蟒衣|飞鱼服|斗牛服|麒麟服|顶戴|花翎|补服|马褂|朝珠|顶子|翎子|辫发|发辫|剃头|梳髻|束发|冠裳|满装|汉装|旗袍|旗装' /home/z/my-project/upload/part3/满清兴亡史.txt
结果:4行命中
行71: 发辫
行101: 束发
行135: 冠裳
行247: 黄马褂
```
Step 5: 排除审查
逐条审查所有命中,排除以下误命中:
| 行号 | 匹配词 | 语境 | 判定 |
|---|---|---|---|
| 65 | 帛 | "金帛子女"财物义 | ❌排除 |
| 87 | 带 | "带砺山河"比喻义 | ❌排除 |
| 95 | 缢 | "焚缢"非服饰 | ❌排除 |
| 149 | 纳 | 非服饰语境 | ❌排除 |
| 229 | 逾制 | 建筑逾制非服饰 | 边缘,保留但标注 |
有效命中:13条
Step 6: sed 关键段落提取
bash
sed -n '97,105p' 满清兴亡史.txt # 剃发令全节
sed -n '247,247p' 满清兴亡史.txt # 黄马褂段落
sed -n '113,113p' 满清兴亡史.txt # 服明衣冠段落
sed -n '135,135p' 满清兴亡史.txt # 变我中国冠裳段落
操作流程轨迹
文件确认(517行/155KB) → 第1轮grep核心词(约30行命中) → 第2轮grep制度词+专项(15行命中)
→ 第3轮grep清代专项(4行命中) → 排除审查(排除约4条误命中,保留13条有效)
→ 分类整理 → 产出3MD