《江防总论》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《江防总论》服饰相关内容,整理分类总结 输入文件:/home/z/my-project/upload/part3/江防总论.txt
Step 0: 文件基本信息
bash
wc -l /home/z/my-project/upload/part3/江防总论.txt # 8行
wc -c /home/z/my-project/upload/part3/江防总论.txt # 6053字节
结果:小型文件,8行/6KB,为类书体单篇长文,每行字数极多。
Step 1: 读取词库
读取 /home/z/my-project/skills/rysxguji/references/fushi-keywords.md
- 核心服饰词:首服、体服、下服、足服、腰带、佩饰、礼服、衣料、染色纹样 共9类
- 制度动作词:赐予、禁令、等级、礼仪、日常 共5类
- 组合扩展词:品色制度、明代补服、鱼袋制度、冕服体系等8组
- 排除规则表:衣、麻、罗、环、领、带、佩、服、冠、帽、褐、巾、帛、锦、裳等15组
Step 2: 第1轮grep — 核心服饰词
bash
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|钗|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/江防总论.txt
结果:1处命中
- 行4:...其视长江衣带固渔人舟子之所以泳游而玩狎之者也...
Step 3: 第2轮grep — 制度动作词
bash
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/江防总论.txt
结果:0处命中
Step 4: 第3轮grep — 组合扩展词(按需)
因前两轮命中极少,按词库5.1策略执行扩展搜索:
bash
rg -n '蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛|布衣|衣冠|衣钵|三品|五品|六品' /home/z/my-project/upload/part3/江防总论.txt
结果:0处命中
Step 5: 对抗式审查
命中词「衣带」(行4)
原文:其视长江衣带固渔人舟子之所以泳游而玩狎之者也
审查过程: 1. "衣带"字面义:衣物腰带 2. 实际用法:比喻义,"视长江如衣带"= 视长江如腰带般狭窄,等同于"一衣带水"典故 3. 描述对象:长江地理宽度,非服饰器物 4. 按《排除规则表》逐条比对: - "带"→ "地带""连带"排除(动词/方位义)→ 本处"衣带"为比喻性地理描述 → 符合排除 - "衣"→ 成语/比喻中 → "若涉服饰细节则保留" → 本处无服饰细节 → 符合排除 5. 判定:排除 ❌
词库外发现「罽毲」(行5)
原文:珠玑孔翠异香文犀罽毲寳幪之贡浮江而入河者
说明: - "罽"=毛织品/毡毯,"毲"=毛毡类织物 - 此为贡物清单中列举的纺织物 - 不在标准词库关键词中,但确实涉及纺织物 - 记录为补充发现 ⚠️
Step 6: sed 上下文提取
```bash
提取行4上下文
sed -n '2,8p' /home/z/my-project/upload/part3/江防总论.txt
结果:确认"衣带"为地理比喻,周围无服饰描述
提取"罽毲"精确语境
rg -n -o '.{0,30}罽.{0,30}' /home/z/my-project/upload/part3/江防总论.txt
结果:珠玑孔翠异香文犀罽毲寳幪之贡 — 确认为贡物清单
```
Step 7: 分类整理
| 编号 | 行号 | 关键词 | 语境类型 | 审查结果 |
|---|---|---|---|---|
| 1 | 4 | 衣带 | 地理比喻 | 排除 |
| 补1 | 5 | 罽毲 | 贡物纺织物 | 词库外补充 |
有效服饰条目:0
Step 8: 生成三份文件
江防总论_总结.md— 结构化总结 + 审查结论江防总论_日志.md— 本文件,操作流程记录江防总论_原文提取.md— 原文摘录(仅含命中片段及审查说明)
操作流程轨迹
文件基本信息✅(8行/6KB) → 读取词库✅ →
第1轮grep✅(1命中) → 第2轮grep✅(0命中) → 第3轮grep✅(0命中) →
对抗式审查✅(衣带→排除) → sed上下文✅ → 分类整理✅ → 生成3份MD
审核结论
- 原文验证:✅ grep行号对应
- 排除规则:✅ 逐条对照词库排除规则表
- 对抗审查:✅ "衣带"虽含服饰字面义,但语境为地理比喻,不含服饰细节
- 补充发现:⚠️ "罽毲"为词库外纺织物,已记录
- 最终结论:本书无实质性服饰内容