《金志》服饰内容提取 — 操作日志
操作时间:2026-05-04
操作者:AI Agent (Subagent)
操作流程
Step 1: 读取参考模板
读取三份模板文件,理解排版格式:
- 参考/总结.md(《吕氏春秋》服饰汇编)
- 参考/日志.md(《警世通言》操作日志)
- 参考/原文提取.md(《天工开物》原文提取)
Step 2: 统计文件基本信息
wc -l 金志.txt → 75 行
wc -c 金志.txt → 15,152 字节
文件较短,共75行,约15KB。
Step 3: 多轮grep提取服饰关键词
第一轮:基础服饰名词
| 关键词 | 命中行数 | 关键词 | 命中行数 |
|---|---|---|---|
| 衣 | 4 | 布 | 3 |
| 裳 | 1 | 绢 | 1 |
| 袍 | 1 | 锦 | 2 |
| 衫 | 1 | 罗 | 2 |
| 裙 | 1 | 纱 | 1 |
| 袄 | 1 | 绸 | 2 |
| 裤 | 1 | 绣 | 3 |
| 袜 | 1 | 织 | 1 |
| 冠 | 2 | 蚕 | 1 |
| 巾 | 2 | 麻 | 1 |
| 笄 | 1 | 帛 | 2 |
| 环 | 1 | 素 | 1 |
| 带 | 1 | 毡 | 1 |
| 丝 | 1 |
无命中的关键词:鞋、履、靴、帽、簪、钗、佩、绶、笏、裘、葛、绮、绫、缎、棉、绒、褐、染、茧、缟、絺、绤、黻、黼
第二轮:复合服饰术语
| 关键词 | 命中行数 |
|---|---|
| 服色 | 3 |
| 冠服 | 1 |
| 赐紫 | 1 |
| 服紫 | 1 |
| 衣白 | 1 |
无命中的关键词:章服、品色、舆服、赐服、借紫、服绯、补服、龙袍、凤冠、霞帔、抹额、璎珞、禁步、玉佩、鱼袋、头戴、身穿、脚穿、着衣、穿衣、衣青、衣朱、衣黄、衣黑、衣玄
Step 4: sed提取上下文
提取以下行号范围的上下文:
| 行号范围 | 章节 | 关键词命中 |
|---|---|---|
| 8-10 | 初兴风土 | 麻、细布、厚毛为衣、衣屦 |
| 11-15 | 男女冠服 | 衣、裳、衫、裙、袄、裤、袜、冠、巾、丝、锦、绸、绢、布、织、绣 |
| 16-18 | 婚姻 | 衣一袭、及笄 |
| 28-32 | 浮图 | 赐紫、袈裟、僧服 |
| 44-46 | 屯田 | 春秋量给衣服 |
| 56-58 | 旗帜 | 红绡、素帛、绣旗 |
| 60-62 | 车伞 | 锦绣、青毡 |
| 64-70 | 服色 | 服色、纱幞头、赭袍、衮冕法服、皂巾 |
Step 5: 精简筛选
保留的段落(8类):
1. 男女冠服(第11-15行)— 核心服饰描写,内容最丰富
2. 服色制度(第64-69行)— 官品服色、国主服制
3. 僧侣服饰(第28-32行)— 赐紫、袈裟等级
4. 婚嫁服饰(第17行)— 衣一袭、及笄
5. 屯田军衣(第45行)— 春秋量给衣服
6. 旗帜织物(第57行)— 红绡、素帛、绣旗
7. 车舆装饰(第61行)— 锦绣青毡
8. 风土物产(第9行)— 麻谷、细布、厚毛为衣
排除的噪音:
- 第5行"服属契丹":此为政治臣属之意,非服饰
- 第17行"罗拜":此为跪拜动作,非服饰
- 第75行四库总目附录:为后人考证文字,非正文服饰记载(仅保留"制度服色俱颇该备"一句作为佐证)
筛选后数据量: 约3,000字符,远低于1M上限。
Step 6: 撰写三份MD文档
按模板格式撰写了:
1. 金志_总结.md — 服饰结构化综述(~2.4KB)
2. 金志_日志.md — 操作日志(本文件)
3. 金志_原文提取.md — 带行号原始片段
Step 7: 对抗式学术审查
| 审查项 | 结果 |
|---|---|
| 总结中"衣白栎"是否存在 | ✓ 第13行grep命中 |
| 总结中"大袄子"是否存在 | ✓ 第13行grep命中 |
| 总结中"锦裙"是否存在 | ✓ 第13行grep命中 |
| 总结中"衮冕法服"是否存在 | ✓ 第69行grep命中 |
| 总结中"真红袈裟"是否存在 | ✓ 第29行grep命中 |
| 总结中"红绡"是否存在 | ✓ 第57行grep命中 |
| 总结中"素帛"是否存在 | ✓ 第57行grep命中 |
| 总结中"锦绣"是否存在 | ✓ 第61行grep命中 |
| 总结中"青毡"是否存在 | ✓ 第61行grep命中 |
| 总结中"服色"是否存在 | ✓ 第65、67行grep命中 |
| 总结中"贯"是否存在 | ✓ 第67行grep命中 |
| 总结中"鱼"是否存在 | ✓ 第67行grep命中 |
| 有无虚构内容 | 无,所有引用均可溯源 |
| OCR残缺符号处理 | 第69行"服■〈纟页〉"据实保留 |
保存文件
| 文件 | 路径 | 大小 |
|---|---|---|
| 服饰总结 | 载记output/金志/金志_总结.md | ~2.4KB |
| 操作日志 | 载记output/金志/金志_日志.md | 本文件 |
| 原文提取 | 载记output/金志/金志_原文提取.md | ~3KB |
备注
- 《金志》篇幅极短(75行/15KB),服饰内容集中在"男女冠服"和"服色"两个专节
- 全书服饰关键词命中率较低(总命中约40行次),因该书为制度志书而非文学作品
- 四库全书总目附录评价"所列制度服色俱颇该备",说明本书服饰记载在当时已受重视
- 文件中"■〈纟页〉"为原文OCR/排版残缺,疑为"縤"或"絤"字