《清异录》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《清异录》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -c -l /home/z/my-project/upload/part3/清异录.txt
结果:155725 bytes(约152KB),2850 行
```
Step 2: 第1轮grep — 核心服饰词
```bash rg -c '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/清异录.txt
结果:219 行命中
```
Step 3: 第2轮grep — 制度动作词
```bash rg -c '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/清异录.txt
结果:6 行命中
```
关键命中: - 行289:裘马衣冠,僣逼逾制 - 行971/973:赐紫樱桃(食物名,排除) - 行2379:品色(评瓷器,排除) - 行2533:赐绯含香糭子(食物名,排除) - 行2663:赐绯羊(食物名,排除)
Step 4: 第3轮grep — 组合扩展词
```bash rg -n '缬|染|织|纱|绫|缎|绮|绢|帛|丝衣|金线|缕金|砑金|织金|妆花|缂丝' /home/z/my-project/upload/part3/清异录.txt
结果:约30行命中,包含大量织物、染色、妆饰条目
```
Step 5: 对抗式审查
逐条审查排除:
| 命中词 | 误命中场景 | 判定 |
|---|---|---|
| 赐紫 | "赐紫樱桃"=食物别名 | 排除——非服饰赐紫 |
| 赐绯 | "赐绯含香糭子""赐绯羊"=食物 | 排除——非服饰赐绯 |
| 品色 | "甆瓶品色"=瓷器评品 | 排除——非品色制度 |
| 罗 | "罗捕者""罗隐""罗虬"=人名/动词 | 排除——非丝织品 |
| 锦 | "锦雉""锦地鸥"=鸟名 | 排除——非织物 |
| 锦 | "锦洞天""锦心氏"=比喻 | 排除——非织物 |
| 绣 | "绣水团""绣腹郎"=龙眼/槐树别名 | 排除——非刺绣 |
| 纹 | "花纹""起纹"=器物纹路 | 视语境——部分排除 |
| 葛 | "葛从周"=人名 | 排除——非布料 |
| 冠 | "冠军""冠绝" | 排除——非首服 |
| 麻 | "麻黄"=药名 | 排除——非布料 |
| 帽 | "帽子"语境需判断 | 保留——首服 |
| 裙 | "裙襕大夫"=鳖别名 | 排除——非服饰 |
| 袍 | "锦袍氏"=鳜鱼别名 | 排除——非服饰 |
经审查,有效服饰条目约49处。
Step 6: sed提取上下文
```bash
核心段:衣服门
sed -n '1710,1810p' 清异录.txt # 约100行,含25条服饰条目
装饰门
sed -n '1833,1841p' 清异录.txt # 北苑妆、画眉
散见段落
sed -n '240,244p' # 软绣天街 sed -n '275,290p' # 衣裳福、僣逼逾制 sed -n '304,314p' # 钗奁、金搭膝 sed -n '363,368p' # 天梳日帽 sed -n '445,461p' # 砑金虚缕列环、紫织方 sed -n '485,492p' # 三只韈 sed -n '803,808p' # 香琼绶带 sed -n '1291,1296p' # 相如锦/鹔鹴裘 sed -n '1389,1393p' # 涂金折枝蜻蜓 sed -n '1431,1435p' # 白角衫 sed -n '1847,1857p' # 缬帐、六合被 sed -n '1885,1892p' # 青纱连二枕 sed -n '2419,2423p' # 缕金耐重儿 sed -n '2697,2702p' # 刀圭第一香/黄绫角 sed -n '2821,2825p' # 大小脱空/绫绡 ```
Step 7: 分类
- 首服:13条(幞头5、巾帽6、冠簪2)
- 体服:15条(衫袄袍7、氅裙3、其他5)
- 下服:3条(裙1、袴2)
- 足服:4条(履1、韈2、鞵1)
- 腰带佩饰:5条
- 织物染色:6条
- 妆饰:3条
Step 8: 生成三份文件
清异录_总结.md— 结构化总结+49条分类表清异录_日志.md— 本操作日志清异录_原文提取.md— 原文摘录
操作流程轨迹
文件152KB/2850行 → 第1轮grep 219行命中 → 第2轮grep 6行命中
→ 第3轮grep ~30行命中 → 对抗式审查排除170+误命中
→ 有效命中49条 → sed提取25段上下文 → 分类7大类
→ 生成3MD
审核结果
- 原文验证:✅ grep行号对应
- 误命排除:✅ 219行→49条,严格审查
- 文件大小:✅ 各文件<20KB