《岭海舆图》服饰内容提取 — 操作日志
操作时间:2026-05-03 操作者:AI Subagent
操作流程
Step 1: 读取技能文件
read ~/.openclaw/skills/rysxguji/SKILL.md
→ 获取"扩展能力:本地TXT服饰逐本整理"章节操作规范
Step 2: 读取参考模板
read /root/.openclaw/workspace/参考/总结.md → 《吕氏春秋》服饰综述模板
read /root/.openclaw/workspace/参考/日志.md → 《警世通言》操作日志模板
read /root/.openclaw/workspace/参考/原文提取.md → 《天工开物》原文提取模板
Step 3: 确认输入文件
wc -l /root/.openclaw/workspace/地理2/岭海舆图.txt
→ 499行,约5万字
Step 4: 文件名编码问题处理
直接 grep 岭海舆图.txt 报错"No such file or directory"
→ 原因:shell locale 无法匹配 UTF-8 文件名
→ 解决:cp 岭海舆图.txt /tmp/lh.txt,后续操作基于 /tmp/lh.txt
Step 5: 多轮关键词 grep 搜索
第1轮:基础服饰关键词
grep -n '衣' /tmp/lh.txt → 3行命中(行222、396、488-489)
- 行222:衣冠文物(文化象征用语)
- 行396:布衣有疏(身份代称)
- 行488-489:熏衣香(朝贡品,非服饰)
第2轮:扩展服饰+军事装备关键词
grep -n '裳\|袍\|衫\|裙\|冠\|帽\|靴\|鞋\|袜\|带\|佩\|锦\|绣\|绫\|罗\|绢\|丝\|绸\|缎\|裘\|褐\|布\|麻\|葛\|服\|织\|染\|蚕\|茧\|纱\|甲\|盔\|铠\|胄\|冕\|弁\|簪\|缨\|绅\|绒\|毡' /tmp/lh.txt
命中行分布:
- 行3:总叙(布政按察二司·行政术语)
- 行16:湛若水序(布按都三司·行政术语)
- 行24:凡例(布按二司·行政术语)
- 行72-76:总图说(布政司·行政术语)
- 行89:黄麻课税
- 行96-97:军器配置(盔、甲、皮撒袋、勒甲皮带)← 核心服饰相关内容
- 行123-136:广州府(带海/丝/黄麻·行政+税收)
- 行185-195:韶州府(丝折米/黄麻·税收)
- 行222:衣冠文物 ← 文化象征
- 行228:田地山塘(丝·度量单位)
- 行245-263:惠州府(丝/黄麻·税收+军制)
- 行297:潮州(黄麻·税收)
- 行320-330:肇庆府(黄麻·税收)
- 行360-371:高州府(茧丝·比喻用法/黄麻·税收)
- 行396:布衣 ← 身份代称
- 行424-437:雷州府(黄麻·税收/军制)
- 行460-466:琼州府(兵甲·军事用语)
- 行488-497:南夷朝贡方物 ← 核心服饰相关内容(织物品种)
第3轮:精确提取服饰描写
grep -n '衣冠\|布衣\|盔\|甲\|带\|丝\|布\|麻\|纱\|絣\|綿\|被\|缦\|绒\|织\|染\|蚕\|茧\|缎\|绸\|绢\|罗\|锦\|绣' /tmp/lh.txt
→ 补充确认行89、136、192、195、256、297、330、371、433等税收行中的黄麻、丝记载
Step 6: sed 提取上下文
对核心命中行(96-97、222、396、488-497)使用 read 工具提取完整上下文段落。
Step 7: 冗余噪音过滤
过滤规则:
- "布政司""布按二司"等行政术语中的"布"→ 不属服饰
- "丝"作为度量单位(如"九丝三忽")→ 不属服饰
- "黄麻鱼线胶"等渔业原料课税 → 边缘相关,降权处理
- "茧丝保障"为比喻用法 → 不属服饰实物
- "兵甲""甲子门"等军事/地名 → 部分保留(盔甲属军事装备)
保留项:
- 行96-97:军器中的盔、甲、皮撒袋、勒甲皮带
- 行222:衣冠文物(文化象征,需标注)
- 行396:布衣(身份代称,需标注)
- 行488-497:南夷朝贡织物品名
Step 8: 对抗式学术审查
检查1:原文存在性验证
行96 "六瓣明衬盔各二十顶齐腰甲二十付" → ✅ grep命中
行222 "衣冠文物" → ✅ grep命中
行396 "布衣有疏" → ✅ grep命中
行489 "畨纱红印花布油红绵布" → ✅ grep命中
检查2:结论支撑性
- "服饰内容极少" → ✅ 全书499行,服饰相关仅约15行
- "军器为最集中服饰内容" → ✅ 行96-97明确列出盔甲配置
- "朝贡织物品种丰富" → ✅ 行488-497列出20+种织物
- "不具备独立服饰史料价值" → ✅ 本书为舆地图志,非服饰专著
检查3:排除误判
- "蚕食"(行185韶州府)→ 比喻用法,非蚕桑纺织
- "茧丝保障"(行360高州府)→ 比喻用法
- "绸缪牖户"(行424雷州府)→ 《诗经》典故,非纺织
审查结论:全部通过 ✅
Step 9: 产出三份MD
- 总结.md:~2KB,结构化综述+对抗式审查
- 日志.md:本文件
- 原文提取.md:带行号原始片段
关键发现
- 本书为舆地图志而非服饰专著,服饰内容属于地理行政文献中的附带记载
- 军器配置是最集中的"服饰"内容(行96-97),反映明代卫所装备制度
- 南夷朝贡织物品名最丰富(行488-497),涉及印度洋-东南亚-中国三大纺织体系
- 无品色制度、无冕服制度、无日常服饰描写,与典型的舆服志类文献截然不同
- "衣冠文物"为文化象征用语,非服饰实物描述
- 全书服饰相关内容约500字,占全书比例不足1%
保存文件
| 文件 | 路径 | 大小 |
|---|---|---|
| 服饰综述 | 地理2output/岭海舆图/岭海舆图_总结.md | ~2KB |
| 操作日志 | 地理2output/岭海舆图/岭海舆图_日志.md | 本文件 |
| 原文提取 | 地理2output/岭海舆图/岭海舆图_原文提取.md | ~3KB |
备注
- 输入文件编码为UTF-8,shell locale不匹配导致grep无法直接操作中文文件名,通过cp到/tmp解决
- 全书499行,体量较小,无需分批处理
- 本书服饰内容稀少是客观事实,非提取遗漏——总结中已如实反映