研究总结 处理日志 原文载录
◈ 处理日志

岭海舆图

《岭海舆图》服饰内容提取 — 操作日志

操作时间:2026-05-03 操作者:AI Subagent


操作流程

Step 1: 读取技能文件

read ~/.openclaw/skills/rysxguji/SKILL.md
→ 获取"扩展能力:本地TXT服饰逐本整理"章节操作规范

Step 2: 读取参考模板

read /root/.openclaw/workspace/参考/总结.md → 《吕氏春秋》服饰综述模板
read /root/.openclaw/workspace/参考/日志.md → 《警世通言》操作日志模板
read /root/.openclaw/workspace/参考/原文提取.md → 《天工开物》原文提取模板

Step 3: 确认输入文件

wc -l /root/.openclaw/workspace/地理2/岭海舆图.txt
→ 499行,约5万字

Step 4: 文件名编码问题处理

直接 grep 岭海舆图.txt 报错"No such file or directory"
→ 原因:shell locale 无法匹配 UTF-8 文件名
→ 解决:cp 岭海舆图.txt /tmp/lh.txt,后续操作基于 /tmp/lh.txt

Step 5: 多轮关键词 grep 搜索

第1轮:基础服饰关键词

grep -n '衣' /tmp/lh.txt → 3行命中(行222、396、488-489)
  • 行222:衣冠文物(文化象征用语)
  • 行396:布衣有疏(身份代称)
  • 行488-489:熏衣香(朝贡品,非服饰)

第2轮:扩展服饰+军事装备关键词

grep -n '裳\|袍\|衫\|裙\|冠\|帽\|靴\|鞋\|袜\|带\|佩\|锦\|绣\|绫\|罗\|绢\|丝\|绸\|缎\|裘\|褐\|布\|麻\|葛\|服\|织\|染\|蚕\|茧\|纱\|甲\|盔\|铠\|胄\|冕\|弁\|簪\|缨\|绅\|绒\|毡' /tmp/lh.txt

命中行分布:

  • 行3:总叙(布政按察二司·行政术语)
  • 行16:湛若水序(布按都三司·行政术语)
  • 行24:凡例(布按二司·行政术语)
  • 行72-76:总图说(布政司·行政术语)
  • 行89:黄麻课税
  • 行96-97:军器配置(盔、甲、皮撒袋、勒甲皮带)← 核心服饰相关内容
  • 行123-136:广州府(带海/丝/黄麻·行政+税收)
  • 行185-195:韶州府(丝折米/黄麻·税收)
  • 行222:衣冠文物 ← 文化象征
  • 行228:田地山塘(丝·度量单位)
  • 行245-263:惠州府(丝/黄麻·税收+军制)
  • 行297:潮州(黄麻·税收)
  • 行320-330:肇庆府(黄麻·税收)
  • 行360-371:高州府(茧丝·比喻用法/黄麻·税收)
  • 行396:布衣 ← 身份代称
  • 行424-437:雷州府(黄麻·税收/军制)
  • 行460-466:琼州府(兵甲·军事用语)
  • 行488-497:南夷朝贡方物 ← 核心服饰相关内容(织物品种)

第3轮:精确提取服饰描写

grep -n '衣冠\|布衣\|盔\|甲\|带\|丝\|布\|麻\|纱\|絣\|綿\|被\|缦\|绒\|织\|染\|蚕\|茧\|缎\|绸\|绢\|罗\|锦\|绣' /tmp/lh.txt

→ 补充确认行89、136、192、195、256、297、330、371、433等税收行中的黄麻、丝记载

Step 6: sed 提取上下文

对核心命中行(96-97、222、396、488-497)使用 read 工具提取完整上下文段落。

Step 7: 冗余噪音过滤

过滤规则:

  • "布政司""布按二司"等行政术语中的"布"→ 不属服饰
  • "丝"作为度量单位(如"九丝三忽")→ 不属服饰
  • "黄麻鱼线胶"等渔业原料课税 → 边缘相关,降权处理
  • "茧丝保障"为比喻用法 → 不属服饰实物
  • "兵甲""甲子门"等军事/地名 → 部分保留(盔甲属军事装备)

保留项:

  • 行96-97:军器中的盔、甲、皮撒袋、勒甲皮带
  • 行222:衣冠文物(文化象征,需标注)
  • 行396:布衣(身份代称,需标注)
  • 行488-497:南夷朝贡织物品名

Step 8: 对抗式学术审查

检查1:原文存在性验证

行96 "六瓣明衬盔各二十顶齐腰甲二十付" → ✅ grep命中
行222 "衣冠文物" → ✅ grep命中
行396 "布衣有疏" → ✅ grep命中
行489 "畨纱红印花布油红绵布" → ✅ grep命中

检查2:结论支撑性

  • "服饰内容极少" → ✅ 全书499行,服饰相关仅约15行
  • "军器为最集中服饰内容" → ✅ 行96-97明确列出盔甲配置
  • "朝贡织物品种丰富" → ✅ 行488-497列出20+种织物
  • "不具备独立服饰史料价值" → ✅ 本书为舆地图志,非服饰专著

检查3:排除误判

  • "蚕食"(行185韶州府)→ 比喻用法,非蚕桑纺织
  • "茧丝保障"(行360高州府)→ 比喻用法
  • "绸缪牖户"(行424雷州府)→ 《诗经》典故,非纺织

审查结论:全部通过 ✅

Step 9: 产出三份MD

  • 总结.md:~2KB,结构化综述+对抗式审查
  • 日志.md:本文件
  • 原文提取.md:带行号原始片段

关键发现

  1. 本书为舆地图志而非服饰专著,服饰内容属于地理行政文献中的附带记载
  2. 军器配置是最集中的"服饰"内容(行96-97),反映明代卫所装备制度
  3. 南夷朝贡织物品名最丰富(行488-497),涉及印度洋-东南亚-中国三大纺织体系
  4. 无品色制度、无冕服制度、无日常服饰描写,与典型的舆服志类文献截然不同
  5. "衣冠文物"为文化象征用语,非服饰实物描述
  6. 全书服饰相关内容约500字,占全书比例不足1%

保存文件

文件 路径 大小
服饰综述 地理2output/岭海舆图/岭海舆图_总结.md ~2KB
操作日志 地理2output/岭海舆图/岭海舆图_日志.md 本文件
原文提取 地理2output/岭海舆图/岭海舆图_原文提取.md ~3KB

备注

  • 输入文件编码为UTF-8,shell locale不匹配导致grep无法直接操作中文文件名,通过cp到/tmp解决
  • 全书499行,体量较小,无需分批处理
  • 本书服饰内容稀少是客观事实,非提取遗漏——总结中已如实反映