《清代割地谈》服饰内容提取 — 操作日志
日期:2026-03-04 任务:提取《清代割地谈》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/清代割地谈.txt
结果:19行
wc -c /home/z/my-project/upload/part3/清代割地谈.txt
结果:3675 bytes (约3.7KB)
```
极小文件,仍使用grep操作。
Step 2: 第1轮grep — 核心服饰词全搜
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/清代割地谈.txt | wc -l
结果:2行命中
```
Step 3: 第2轮grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/清代割地谈.txt
结果:0行命中
```
Step 4: 排除规则审查
2条命中逐条审查:
| 关键词 | 原文语境 | 判断 |
|---|---|---|
| 领 | "二十五佐领" | 排除——佐领为清代行政/军事单位,非服饰 |
| 领 | "占领之者" | 排除——占领为动词,非服饰 |
第1轮2条命中均为误命中,排除后有效条目0条。
Step 5: 第3轮grep — 清代特有服饰词
```bash rg -n '顶戴|花翎|补服|蟒袍|朝珠|顶子|翎子|黄马褂|吉服冠|朝冠|端罩|披领|朝袍|龙袍|凤冠|霞帔|朝靴|官帽|红顶|蓝顶|金顶' /home/z/my-project/upload/part3/清代割地谈.txt
结果:1条命中
```
发现"赏顶戴"(行5),为有效服饰条目。
Step 6: 创作三份MD
内容级别:极稀少(1条),如实标注。
操作流程轨迹
文件扫描19行/3.7KB → 第1轮grep 2行命中(均为误命中)
→ 第2轮grep 0行命中
→ 排除审查后0条有效
→ 第3轮清代特有词搜到1条"赏顶戴"
→ 创作三份MD
审核结果
- 原文验证:✅ 行5"赏顶戴"验证存在
- 排除规则:✅ "佐领""占领"误命中已排除
- 诚实标注:✅ 如实标注"服饰内容极度稀少"
- 体积检查:✅ 三篇MD均<20KB