返回典籍目录

《金志》服饰内容提取 — 操作日志

操作时间:2026-05-04
操作者:AI Agent (Subagent)


操作流程

Step 1: 读取参考模板

读取三份模板文件,理解排版格式:
- 参考/总结.md(《吕氏春秋》服饰汇编)
- 参考/日志.md(《警世通言》操作日志)
- 参考/原文提取.md(《天工开物》原文提取)

Step 2: 统计文件基本信息

wc -l 金志.txt → 75 行
wc -c 金志.txt → 15,152 字节

文件较短,共75行,约15KB。

Step 3: 多轮grep提取服饰关键词

第一轮:基础服饰名词

关键词 命中行数 关键词 命中行数
4 3
1 1
1 2
1 2
1 1
1 2
1 3
1 1
2 1
2 1
1 2
1 1
1 1
1

无命中的关键词:鞋、履、靴、帽、簪、钗、佩、绶、笏、裘、葛、绮、绫、缎、棉、绒、褐、染、茧、缟、絺、绤、黻、黼

第二轮:复合服饰术语

关键词 命中行数
服色 3
冠服 1
赐紫 1
服紫 1
衣白 1

无命中的关键词:章服、品色、舆服、赐服、借紫、服绯、补服、龙袍、凤冠、霞帔、抹额、璎珞、禁步、玉佩、鱼袋、头戴、身穿、脚穿、着衣、穿衣、衣青、衣朱、衣黄、衣黑、衣玄

Step 4: sed提取上下文

提取以下行号范围的上下文:

行号范围 章节 关键词命中
8-10 初兴风土 麻、细布、厚毛为衣、衣屦
11-15 男女冠服 衣、裳、衫、裙、袄、裤、袜、冠、巾、丝、锦、绸、绢、布、织、绣
16-18 婚姻 衣一袭、及笄
28-32 浮图 赐紫、袈裟、僧服
44-46 屯田 春秋量给衣服
56-58 旗帜 红绡、素帛、绣旗
60-62 车伞 锦绣、青毡
64-70 服色 服色、纱幞头、赭袍、衮冕法服、皂巾

Step 5: 精简筛选

保留的段落(8类):
1. 男女冠服(第11-15行)— 核心服饰描写,内容最丰富
2. 服色制度(第64-69行)— 官品服色、国主服制
3. 僧侣服饰(第28-32行)— 赐紫、袈裟等级
4. 婚嫁服饰(第17行)— 衣一袭、及笄
5. 屯田军衣(第45行)— 春秋量给衣服
6. 旗帜织物(第57行)— 红绡、素帛、绣旗
7. 车舆装饰(第61行)— 锦绣青毡
8. 风土物产(第9行)— 麻谷、细布、厚毛为衣

排除的噪音:
- 第5行"服属契丹":此为政治臣属之意,非服饰
- 第17行"罗拜":此为跪拜动作,非服饰
- 第75行四库总目附录:为后人考证文字,非正文服饰记载(仅保留"制度服色俱颇该备"一句作为佐证)

筛选后数据量: 约3,000字符,远低于1M上限。

Step 6: 撰写三份MD文档

按模板格式撰写了:
1. 金志_总结.md — 服饰结构化综述(~2.4KB)
2. 金志_日志.md — 操作日志(本文件)
3. 金志_原文提取.md — 带行号原始片段

Step 7: 对抗式学术审查

审查项 结果
总结中"衣白栎"是否存在 ✓ 第13行grep命中
总结中"大袄子"是否存在 ✓ 第13行grep命中
总结中"锦裙"是否存在 ✓ 第13行grep命中
总结中"衮冕法服"是否存在 ✓ 第69行grep命中
总结中"真红袈裟"是否存在 ✓ 第29行grep命中
总结中"红绡"是否存在 ✓ 第57行grep命中
总结中"素帛"是否存在 ✓ 第57行grep命中
总结中"锦绣"是否存在 ✓ 第61行grep命中
总结中"青毡"是否存在 ✓ 第61行grep命中
总结中"服色"是否存在 ✓ 第65、67行grep命中
总结中"贯"是否存在 ✓ 第67行grep命中
总结中"鱼"是否存在 ✓ 第67行grep命中
有无虚构内容 无,所有引用均可溯源
OCR残缺符号处理 第69行"服■〈纟页〉"据实保留

保存文件

文件 路径 大小
服饰总结 载记output/金志/金志_总结.md ~2.4KB
操作日志 载记output/金志/金志_日志.md 本文件
原文提取 载记output/金志/金志_原文提取.md ~3KB

备注