《清秘藏》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《清秘藏》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -c -l /home/z/my-project/upload/part3/清秘藏.txt
结果:56860 bytes(约56KB),188 行
```
Step 2: 第1轮grep — 核心服饰词
```bash rg -c '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/清秘藏.txt
结果:59 行命中
```
Step 3: 第2轮grep — 制度动作词
```bash rg -c '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/清秘藏.txt
结果:0 行命中
```
Step 4: 第3轮grep — 织物专项搜索
```bash rg -n '绣|刻丝|缂丝|锦|绫|绢|帛|绸|纱|罗|织|丝' /home/z/my-project/upload/part3/清秘藏.txt
结果:约30行命中
```
关键命中: - 行97-99:论宋绣刻丝 - 行103-108:论古纸绢素、装背不用绢 - 行159:冰蚕锦 - 行167-168:叙唐宋锦绣(核心段) - 行183:凤头钗、玉环
Step 5: 对抗式审查
| 命中词 | 误命中场景 | 判定 |
|---|---|---|
| 纹 | "卧蚕纹""龟纹"= 玉器纹路 | 保留——部分亦为织物纹样名 |
| 纹 | "绦纹"= 砚石纹 | 排除——器物纹理 |
| 丝 | "丝发""一丝"= 比喻 | 排除——非丝织品 |
| 罗 | "细罗纹石"= 砚石 | 排除——非丝织品 |
| 绢 | "绢筛""绢素"= 装裱用绢 | 保留——书画绢素鉴别 |
| 锦 | "锦囊"= 收藏用品 | 保留——织物制品 |
| 绣 | "绣"在宋绣中 | 保留——刺绣工艺 |
| 纹 | "锦纹"在织物名目中 | 保留——织物纹样 |
经审查,有效服饰/织物条目约18处。
Step 6: sed提取上下文
bash
sed -n '97,100p' # 论宋绣刻丝
sed -n '103,109p' # 论古纸绢素
sed -n '159,162p' # 冰蚕锦
sed -n '167,169p' # 叙唐宋锦绣
sed -n '183,184p' # 凤头钗、玉环
Step 7: 分类
- 宋绣:4条
- 刻丝(缂丝):3条
- 唐宋锦绣名目:4条(含50余种锦名、10余种绫名)
- 绢素鉴别:5条
- 古代名宝织物:1条
- 玉器首饰:1条
Step 8: 生成三份文件
清秘藏_总结.md— 结构化总结+锦绣名目表清秘藏_日志.md— 本操作日志清秘藏_原文提取.md— 原文摘录
操作流程轨迹
文件56KB/188行 → 第1轮grep 59行命中 → 第2轮grep 0行命中
→ 第3轮织物专项 ~30行命中 → 对抗式审查排除约12处误命中
→ 有效命中18条 → sed提取5段上下文 → 分类6大类
→ 生成3MD
审核结果
- 原文验证:✅ grep行号对应
- 误命排除:✅ 59行→18条
- 文件大小:✅ 各文件<20KB