研究总结 处理日志 原文载录
◈ 处理日志

金陵物产风土志

《金陵物产风土志》服饰内容整理操作日志

操作时间:2026-05-02 16:58 操作者:子Agent(geo-book-043)


操作流程

Step 1: 文件初检

wc -l /root/.openclaw/workspace/地理/金陵物产风土志.txt
→ 32行

判断:全文仅32行,为短篇方志。可全量grep,无需分段处理。

Step 2: 第1轮宽搜——服饰专用词库

grep -n "衣\|裳\|服\|袍\|衫\|袄\|裙\|褐\|冠\|帽\|巾\|靴\|鞋\|袜\|首饰\|穿戴\|纺织\|染色\|品色\|舆服\|冠服\|章服\|命妇\|赐服\|龙袍\|蟒袍\|朝服\|祭服\|丧服\|孝服\|裹足\|缠足" \
  /root/.openclaw/workspace/地理/金陵物产风土志.txt

命中行:4, 5, 6, 30

  • 行4:"衣食"(泛指,非服饰专义)
  • 行5:"罗纨争腻""土丝""织段""白货""染色"(蚕桑丝织)
  • 行6:"解衣赤足"(取鱼动作,非服饰描写)
  • 行30:缎、绒、纱、绸、花机、织工、染经、湖丝(核心段

Step 3: 第2轮扩展搜——纺织材料词库

grep -n "葛布\|苎布\|麻布\|绵花\|蓝靛\|蚕\|桑\|织\|绣\|锦\|绮\|绫\|罗\|缎\|绸\|耕织\|蚕桑\|女红\|机杼\|织染\|布\|帛\|丝\|绢\|绡\|绒\|毯\|毡" \
  /root/.openclaw/workspace/地理/金陵物产风土志.txt

命中行:5, 6, 11, 15, 24, 26, 29, 30, 31, 32

  • 行5:桑、蚕、罗纨、丝、织段、染色(有效
  • 行6:织("往来若织"为比喻,非服饰)
  • 行11:锦("花开如锦"为比喻,非服饰)
  • 行15:丝、鸭(无关)
  • 行24:丝(蚕豆相关,非服饰)
  • 行26:红曲(食品,非服饰)
  • 行29:丝(桃丝为扇骨材料,非服饰)
  • 行30:织、缎、绒、纱、绸、丝(核心段
  • 行31:绒、织、装束(有效
  • 行32:织业(总结性提及)

Step 4: sed提取关键上下文

行5(蚕桑段)

sed -n '5p' /root/.openclaw/workspace/地理/金陵物产风土志.txt
→ 完整段落约200字,内容紧凑,无需截取

行30(织造核心段)

sed -n '30p' /root/.openclaw/workspace/地理/金陵物产风土志.txt
→ 完整段落约350字,为全书服饰内容最集中段落

行31(妆饰段)

sed -n '31p' /root/.openclaw/workspace/地理/金陵物产风土志.txt
→ 完整段落约100字

Step 5: 噪音过滤

行号 原始匹配 判定 理由
4 衣食 ❌ 排除 泛指生活,非服饰
6 解衣赤足 ❌ 排除 取鱼动作描写
11 花开如锦 ❌ 排除 比喻用法
15 去其毛 ❌ 排除 宰鸭去毛
24-26 红曲等 ❌ 排除 食品加工
29 桃丝 ❌ 排除 扇骨材料
5 蚕桑丝织 ✅ 保留 直接相关
30 织造业 ✅ 保留 核心内容
31 妇人妆饰 ✅ 保留 直接相关

Step 6: 分类梳理

有效服饰内容分3大类:

  1. 蚕桑丝织(行5):产区、土丝品质、白货、学堂教法
  2. 织造业(行30):产品体系、生产组织、工艺流程、销售网络
  3. 妇人妆饰(行31):领标襟裾装饰、花胜、香粉佩囊、装束变迁

Step 7: 对抗式学术审查

检查项 操作 结果
原文存在性 grep验证所有引文 ✅ 全部命中
文献完整性 wc -l确认全文 ✅ 32行完整
出处准确性 逐段比对引文与原文 ✅ 一致
结论支撑度 逐条检查分析是否有原文依据 ✅ 通过
术语准确性 "靴"释为缎品名目 ⚠️ 据上下文推断,标注说明

Step 8: 输出文件

文件 大小 状态
金陵物产风土志_总结.md ~3.5KB ✅ <20KB
金陵物产风土志_日志.md 本文件 ✅ <20KB
金陵物产风土志_原文提取.md 待生成

关键发现

  1. 本书为短篇方志,非服饰专著,服饰内容仅占全文约15-20%
  2. 第30段为核心:金陵织造业产业链完整记载,是清代南京丝织业珍贵史料
  3. 产业视角:与正史舆服志的制度视角不同,本书从生产经营角度记录服饰
  4. "莫美于靴"之"靴":需注意此处非鞋靴义,乃缎品名目
  5. 女工制度:络工为贫女提供生计,体现"寓恤贫之意"的社会功能
  6. 装束变迁:作者明确记录"今装束已稍稍异矣",有存古意识

操作耗时

步骤 耗时
文件初检 ~1s
第1轮grep ~1s
第2轮grep ~1s
sed提取 ~1s
噪音过滤+分类 ~30s
对抗式审查 ~30s
MD创作 ~3min
合计 ~5min