《白田杂著》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《白田杂著》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -c -l /home/z/my-project/upload/part3/白田杂著.txt
结果:257991 bytes(约252KB),426 行
```
文件性质:清代学术考证笔记,王懋竑撰,以经学、朱子学考订为主
Step 2: 第1轮grep — 核心服饰词
```bash rg -c '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/白田杂著.txt
结果:61 行命中
```
Step 3: 第2轮grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/白田杂著.txt
结果:约20行命中,多数为"冠礼"礼制讨论
```
Step 4: 第3轮grep — 组合扩展词
```bash rg -n '冠礼|冠者|加冠|冠于|四橞衫|巾|帻|帽|裘|袍|裙|履|笏|绶|朝服|公服|常服|祭服|丧服|深衣|衣裳|布衣|衣冠|赐服|品色|服色|章服|冕|弁|带|佩|鱼袋|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|卤簿|仪仗|黼|黻' /home/z/my-project/upload/part3/白田杂著.txt
结果:35 行命中
```
Step 5: 对抗式审查
| 命中词 | 误命中场景 | 判定 |
|---|---|---|
| 冠 | "冠绝""冠于"= 动词 | 排除——非首服 |
| 冠 | "冠礼""冠者""加冠"= 冠礼制度 | 保留——冠礼服制 |
| 衣冠 | "衣冠之祸"= 政治代词 | 排除——非服饰 |
| 衣冠 | "毁冠裂冕"= 比喻义 | 排除——非服饰 |
| 衣冠 | "整衣冠齐容貌"= 持敬功夫 | 保留——服饰与礼制 |
| 巾 | "黪巾""生绢黪巾"= 忌日首服 | 保留——丧服变服 |
| 服 | "服丧""服制"= 礼制 | 保留——丧服制度 |
| 服 | "四橞衫"= 冠礼加服 | 保留——冠礼服制 |
| 麻 | 无明显"麻制"误命 | N/A |
| 罗 | "罗参议""罗椅"= 人名 | 排除 |
| 绅 | "缙绅"= 士大夫代称 | 排除——非腰带 |
| 带 | "素带"= 忌日服饰 | 保留——丧服变服 |
经审查,有效服饰条目仅11处,属稀少等级。
Step 6: sed提取上下文
bash
sed -n '78,80p' # 冠礼主人、加冠、加巾、四橞衫
sed -n '107,107p' # 忌日变服、黪布素服、生绢黪巾
sed -n '358,358p' # 整衣冠齐容貌
Step 7: 分类
- 冠礼服制:6条
- 忌日变服:4条
- 持敬与衣冠:1条
Step 8: 生成三份文件
白田杂著_总结.md— 结构化总结+11条分类表白田杂著_日志.md— 本操作日志白田杂著_原文提取.md— 原文摘录
操作流程轨迹
文件252KB/426行 → 第1轮grep 61行命中 → 第2轮grep ~20行命中
→ 第3轮grep 35行命中 → 对抗式审查排除80+误命中
→ 有效命中11条 → sed提取3段上下文 → 分类3大类
→ 生成3MD
审核结果
- 原文验证:✅ grep行号对应
- 误命排除:✅ 61行→11条
- 文件大小:✅ 各文件<20KB