《史通会要》服饰内容提取 · 操作日志
时间:2026-05-06 00:32 — 00:45
任务:提取《史通会要》全部服饰相关内容,整理分类总结
输入:~/.openclaw/workspace/史评/002/史通会要.txt(77KB,597行)
操作流程
Step 1: 文件基本信息确认
wc -c ~/.openclaw/workspace/史评/002/史通会要.txt
# 结果:77001 字节(约77KB)
wc -l ~/.openclaw/workspace/史评/002/史通会要.txt
# 结果:597 行
Step 2: 多轮grep关键词检索
第1轮:核心服饰词(冠/冕/服/衣)
grep -n '冠\|冕\|服\|衣' 史通会要.txt | head -100
结果:命中约20行。但绝大多数为非服饰用法:
- 「服食」→ 道教养生术语
- 「舆服」→ 史志分类名
- 「浣衣」→ 典故引用
- 「绣衣直指」→ 汉代官职名
- 文本中大量「服」字出现在「信服」「服从」「衣服有量」等非服饰语境
第2轮:纺织材质词(裳/裘/帛/锦/绮/绫/罗/缎/褐/袍)
grep -n '裳\|裘\|帛\|锦\|绮\|绫\|罗\|缎\|褐\|袍' 史通会要.txt | head -100
结果:命中约10行。有效条目:
- 行283/589:「绢帛」→ 书写材料
- 「罗含」「罗万象」「网罗」→ 人名或动词,非纺织品
第3轮:佩饰/工艺词(带/绶/笏/履/舄/佩/饰/绣/染/丝)
grep -n '带\|绶\|笏\|履\|舄\|佩\|饰\|绣\|染\|丝' 史通会要.txt | head -100
结果:命中约15行。有效条目:
- 行287/593:「绣衣直指」→ 官职名
- 行245/551:「伪饰」→ 假造修饰
- 行111/417:「挂丝」→ 人名典故(张伯德梦挂丝)
- 多数「饰」字为「修饰」「润饰」等文论术语
第4轮:服饰配件词(绸/绢/布/甲/胄/巾/帽/钗/簪/笄)
grep -n '绸\|绢\|布\|甲\|胄\|巾\|帽\|钗\|簪\|笄' 史通会要.txt | head -100
结果:命中约5行。有效条目:
- 行283/589:「绢帛」已记录
- 「布衣」未出现
- 「甲」字出现于「太甲」等人名
第5轮:制度术语词(品色/紫袍/绯袍/章服/衮冕/朝服/祭服/舆服/冕服/补服/赐紫/赐绯)
grep -n '品色\|紫袍\|绯袍\|章服\|衮冕\|朝服\|祭服\|舆服\|冕服\|补服\|赐紫\|赐绯' 史通会要.txt | head -100
结果:命中2行(行71/377),均为「舆服」→ 史志分类名。
第6轮:补充检索(裸葬/声容/文物/制度/宫闱)
grep -n '裸葬' 史通会要.txt # 命中:行83/389
grep -n '声容盛\|武备衰' 史通会要.txt # 命中:行249/555
grep -n '文物' 史通会要.txt # 命中:行245/551
第7轮:衣裳/衣冠/冠带 词组
grep -n '衣裳\|衣冠\|冠带' 史通会要.txt
# 结果:无命中(退出码1)
Step 3: 文本重复性检测
diff <(sed -n '1,294p' 史通会要.txt) <(sed -n '303,596p' 史通会要.txt) | head -20
结果:行300-597为行1-294的近似重复(OCR略有差异如「九州岛」vs「九州岛岛」)。有效文本为行1-294 + 行295-296(四库提要)。
Step 4: 有效服饰条目提取
最终确认的有效服饰相关条目共6处(去重后):
| 序号 | 行号 | 关键词 | 语境 |
|---|---|---|---|
| 1 | 71 | 舆服 | 史志分类名目 |
| 2 | 83 | 浣衣、裸葬 | 班固论赞典故 |
| 3 | 245 | 伪饰 | 文书伪造 |
| 4 | 249 | 声容盛 | 元人进宋史表 |
| 5 | 283 | 绢帛 | 书写材料供给 |
| 6 | 287 | 绣衣直指 | 汉代官职名 |
Step 5: 撰写三份文档
依据参考模板格式,据实撰写:
1. 史通会要_总结.md — 约2KB
2. 史通会要_日志.md — 本文件,约3KB
3. 史通会要_原文提取.md — 约3KB
关键发现
- 《史通会要》为史评类著作,核心内容是史学理论(史书体例、编纂方法、史官制度),不含服饰专题内容。
- 服饰相关内容极度稀少:全文仅6处间接提及,均为举例性引用或术语性出现。
- 文件存在文本重复:行300-597为行1-294的近似重复,可能是上传/OCR过程中的重复。
- 本书不适合直接用于服饰研究,但其提及的「舆服」志分类理论,对理解正史舆服志的编纂体例有参考价值。
审核结果
全部通过 ✅ — 所有引用均经grep -n验证行号准确,文本为单一文件无分卷问题。