《敕修浙江通志》服饰内容提取 — 操作日志
操作时间:2026-05-02 18:46-19:15 操作者:AI Subagent (geo-book-070) 书目:敕修浙江通志(浙江通志.txt) 文件大小:13,283,058 bytes / 78,683行
操作流程
Step 1: 文件确认
ls /root/.openclaw/workspace/地理/ | grep "浙江"
→ 浙江通志.txt
- 文件名与任务指定名"敕修浙江通志.txt"不同,实际文件名为"浙江通志.txt"
- 确认首行"勅修浙江通志进表",为同一本书
Step 2: 文件基本信息
wc -l → 78,683行
head -20 → 确认为清代雍正敕修官修方志
Step 3: 第1轮宽搜(服饰核心词)
| 关键词 | 命中行数 | 说明 |
|---|---|---|
| 衣 | 1,508 | 含大量非服饰义 |
| 裳 | 117 | |
| 服 | 1,082 | 含大量非服饰义 |
| 袍 | 77 | |
| 冠 | 689 | 含大量非服饰义 |
| 巾 | 168 | |
| 靴 | 6 | |
| 帽 | 37 | |
| 衫 | 24 | |
| 褐 | 94 | |
| 舆服 | 4 | |
| 冠服 | 9 | |
| 命妇 | 7 | |
| 赐服 | 0 | |
| 朝服 | 5 | |
| 祭服 | 4 | |
| 丧服 | 17 | |
| 龙袍 | 0 | |
| 蟒袍 | 0 | |
| 缠足 | 0 | |
| 裹足 | 6 | 多为"止步"义,非缠足义 |
Step 4: 第2轮扩展搜(纺织材料词)
| 关键词 | 命中行数 | 说明 |
|---|---|---|
| 蚕桑 | 14 | 主要为经济地理 |
| 蚕 | 113 | 含大量非纺织义 |
| 桑 | 388 | 含大量地名 |
| 织 | 355 | 含大量非纺织义 |
| 绣 | 187 | |
| 锦 | 536 | 含大量地名(如锦溪) |
| 绫 | 24 | |
| 罗 | 1,043 | 大量为人名 |
| 缎 | 4 | |
| 绸 | 34 | 含地名(绸州) |
| 绢 | 113 | |
| 绮 | 157 | |
| 布 | 1,406 | 含大量"布政"等 |
| 丝 | 1,045 | 含大量非纺织义 |
| 帛 | 198 | |
| 绡 | 16 | |
| 绒 | 5 | |
| 毯 | 1 | |
| 毡 | 2 | |
| 棉 | 14 | |
| 纺 | 320 |
Step 5: 精确grep定位服饰专义行
使用精确grep命令定位含服饰专义的行号:
grep -n "舆服\|冠服\|命妇\|朝服\|祭服\|丧服\|裹足\|缠足\|龙袍\|蟒袍" → 约50行
Step 6: sed提取上下文
对关键行号使用 sed -n '起始行,结束行p' 提取完整上下文段落,主要提取区域:
| 行号范围 | 内容 | 字数 |
|---|---|---|
| 831-832 | 万蚕同织瑞茧上谕 | ~300字 |
| 1192 | 湖州蚕桑之利 | ~50字 |
| 1764 | 织女星与衣裳 | ~30字 |
| 5019 | 西葑漾缫丝 | ~20字 |
| 5588 | 蜀阜山织锦传说 | ~40字 |
| 8162 | 海盐县学祭服 | ~10字 |
| 8369 | 天台县学舆服壁画 | ~30字 |
| 19955 | 冠服布素 | ~10字 |
| 4525-4543 | 衣锦山/锦溪 | ~80字 |
| 46467 | 衢州学祭服 | ~20字 |
| 47472 | 孔愉朝服守宗庙 | ~30字 |
| 48080 | 陈良谟冠服自缢 | ~20字 |
| 48147 | 陈性善朝服赴死 | ~20字 |
| 49186 | 舒清国论命妇封号 | ~30字 |
| 49819 | 俞谏拒朝服入贺 | ~40字 |
| 50376 | 郑汝谐母为命妇 | ~20字 |
| 50392 | 缪主一祭服制度 | ~20字 |
| 51557 | 裹足不肯出 | ~10字 |
| 53228 | 吴诚衣裘朴野 | ~60字 |
| 56750 | 赵卯发妻雍氏盛服 | ~50字 |
| 57766 | 夏开衡妻姚氏命服 | ~80字 |
| 58104 | 程氏二节三品命妇 | ~20字 |
| 59115 | 杨伯瑞妻王氏命妇 | ~40字 |
| 66234-66240 | 丧服文献目录 | ~100字 |
| 67337-67339 | 舆服志文献目录 | ~40字 |
Step 7: 噪音过滤
大量匹配行实际为非服饰义:
- "衣食""衣被""衣食之本" → 经济概念,非服饰描写
- "布政""布衣" → 政治概念
- "罗"→ 多为人名(罗列、罗织)
- "锦"→ 多为地名(锦溪、锦山)
- "裹足"→ 多为"止步"义
- "冠"→ 多为"冠军""冠山"等
Step 8: 分类整理
分为7大类:
- 蚕桑丝织经济(3处)
- 冠服制度文献(8处)
- 祭服与学校礼制(3处)
- 丧服文献(11部)
- 朝服与忠义叙事(3处)
- 命妇服饰(5处)
- 冠服与人格象征(2处)
Step 9: 对抗式审查
逐条验证原文存在性:
- ✅ 万蚕同织瑞茧(行831-832)→ 原文存在
- ✅ 湖州蚕桑之利(行1192)→ 原文存在
- ✅ 天台县学舆服壁画(行8369)→ 原文存在
- ✅ 孔愉朝服守宗庙(行47472)→ 原文存在
- ✅ 陈性善朝服赴死(行48147)→ 原文存在
- ✅ 夏开衡妻姚氏命服(行57766)→ 原文存在
- ✅ 丧服文献目录(行66234-66240)→ 原文存在
- ✅ 舆服志文献目录(行67337-67339)→ 原文存在
Step 10: 保存文件
| 文件 | 大小 |
|---|---|
| 敕修浙江通志_总结.md | ~3.3KB |
| 敕修浙江通志_日志.md | 本文件 |
| 敕修浙江通志_原文提取.md | ~5KB |
关键发现
- 本书服饰内容密度极低:13MB全书中直接服饰描写不超过50行
- 蚕桑经济是核心:湖州蚕桑为最集中的服饰相关内容
- 文献目录为主:丧服、舆服著作多为目录汇编,非原创内容
- 忠义叙事为辅:朝服、命服主要在忠臣烈女叙事中出现
- 无龙袍、蟒袍、缠足等关键词命中:反映清代方志的书写规范
- "裹足"6处均为"止步"义:非缠足义
备注
- 敕修浙江通志为清代雍正年间官修方志,全书以行政、地理、赋役、人物为主体
- 服饰内容非方志关注重点,属附带记载
- 文件编码为UTF-8,部分文字有异体字(如"勅"="敕")