《清波杂志》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《清波杂志》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -c -l /home/z/my-project/upload/part3/清波杂志.txt
结果:227793 bytes(约222KB),618 行
```
Step 2: 第1轮grep — 核心服饰词
```bash rg -c '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/清波杂志.txt
结果:160 行命中
```
Step 3: 第2轮grep — 制度动作词
```bash rg -c '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/清波杂志.txt
结果:1 行命中
```
行499:赐紫衣(僧人赐紫衣制度,保留)
Step 4: 第3轮grep — 组合扩展词
```bash rg -n '朝服|公服|赐衣|衣冠|冠服|章服|品服|服色|赐紫|借紫|借绯|布衣|朱衣|紫袍|绯袍|绿袍|锦袍|金带|玉带|犀带|笏|绶|幞头|乌帽|纱帽|裘|袍|衫|裙|深衣|盖头|帷帽|赭袍|卤簿|仪卫|冠梳|凉衫' /home/z/my-project/upload/part3/清波杂志.txt
结果:约30行命中,含大量服饰制度核心内容
```
Step 5: 对抗式审查
| 命中词 | 误命中场景 | 判定 |
|---|---|---|
| 笏 | "银一笏""索银百笏" = 量词 | 排除——非笏板 |
| 笏 | "李庭珪墨一笏" = 墨量词 | 排除——非笏板 |
| 纹 | "石纹""粟纹" = 器物纹理 | 排除——非纹样 |
| 绣 | "锦绣"在比喻中 | 视语境 |
| 冠 | "冠军""冠绝" | 排除 |
| 带 | "地带""带领""连带" | 排除 |
| 衣 | "衣钵" | 排除——传法义 |
| 佩 | "钦佩" | 排除 |
| 领 | "领悟""带领" | 排除 |
| 履 | "履行""亲履" | 排除 |
| 环 | "环列""环境" | 排除 |
经审查,有效服饰条目约37处。
Step 6: sed提取上下文
```bash
核心段
sed -n '48,52p' # 祖宗家法冠服 sed -n '82,86p' # 南渡更衣制 sed -n '89,95p' # 诰命织物、金带 sed -n '135,139p' # 夫人裙带 sed -n '194,198p' # 绵裘、眼衣 sed -n '242,246p' # 花巾丝履 sed -n '275,279p' # 青衫 sed -n '286,290p' # 巾裹红袍 sed -n '314,320p' # 皇祐冠梳禁令 sed -n '316,320p' # 布裙荆钗 sed -n '440,444p' # 虎皮氊裘 sed -n '497,501p' # 赐紫衣 sed -n '524,528p' # 借服佩鱼 sed -n '559,562p' # 服色定序、借紫 sed -n '571,575p' # 深衣、赭袍卤簿 ```
Step 7: 分类
- 服章制度与品色:6条
- 冠帽巾幞头:7条
- 衣衫袍带:9条
- 妇女服饰与首饰:4条
- 赐服与佩鱼:3条
- 卤簿仪卫:4条
- 民族服饰:2条
- 织物与其他:3条
Step 8: 生成三份文件
清波杂志_总结.md— 结构化总结+37条分类表清波杂志_日志.md— 本操作日志清波杂志_原文提取.md— 原文摘录
操作流程轨迹
文件222KB/618行 → 第1轮grep 160行命中 → 第2轮grep 1行命中
→ 第3轮grep ~30行命中 → 对抗式审查排除120+误命中
→ 有效命中37条 → sed提取15段上下文 → 分类8大类
→ 生成3MD
审核结果
- 原文验证:✅ grep行号对应
- 误命排除:✅ 160行→37条
- 文件大小:✅ 各文件<20KB