《官常典·侍卫部》服饰内容提取 · 操作日志
时间:2026-04-21
任务:提取《官常典·侍卫部》全部服饰相关内容
文件:/home/z/my-project/upload/part2_extracted/官常典侍卫部.txt
输出:/home/z/my-project/upload/p2output/官常典侍卫部/
操作流程
Step 1: 读取参考文件
读取 /home/z/my-project/upload/参考/ 下三份参考文件:
- 总结.md(吕氏春秋服饰总结)
- 日志.md(晋会要提取日志)
- 原文提取.md(天工开物原文提取)
了解输出格式:三份MD(总结/日志/原文提取),各有模板。
Step 2: 检查目标文件
wc -c 官常典侍卫部.txt → 184,169字节(约184KB)
远超20KB限制,禁止整本加载,必须使用grep逐条检索。
Step 3: 55关键词grep检索
使用55个服饰关键词逐一grep计数:
| 关键词 | 命中数 | 备注 |
|---|---|---|
| 衣 | 41 | 含"衣冠""冬衣""衣甲""衣裘"等 |
| 裳 | 1 | 仅1处,无独立意义 |
| 冠 | 14 | 含"鹖冠""大冠""衣冠""冠带"等 |
| 冕 | 5 | 多为官名("冕服"等非独立服饰段) |
| 帻 | 0 | — |
| 巾 | 6 | 含"方巾""纲巾"等 |
| 帽 | 3 | "毡帽""乌纱帽""头帽" |
| 袍 | 3 | "绣袍""锦袍""皂绨袍""豹文袍"等 |
| 裘 | 4 | "衣裘"为主 |
| 褐 | 1 | "短褐"(文学引用) |
| 襦/裙/袴/袂/衽 | 0 | — |
| 绶 | 5 | "佩两绶"等 |
| 佩 | 7 | 佩刀/佩剑为主 |
| 笏 | 3 | "象笏""搢笏"等 |
| 带 | 23 | "束带""铜带""带领"等 |
| 屦/履/舄/靴/鞋/袜 | 靴1, 履4 | 靴:皂靴;履多为人名 |
| 襟/领/袖 | 领77, 襟1, 袖0 | 领77条全为"统领""领掌"等非服饰义 |
| 锦 | 14 | "锦袍"为主 |
| 罗 | 6 | "纱罗" |
| 纱 | 3 | "纱罗""乌纱帽" |
| 绢 | 1 | — |
| 帛/布/丝 | 帛2, 布3, 丝2 | — |
| 衮 | 3 | 非独立服饰段 |
| 朝服 | 1 | 明代千户朝服 |
| 常服 | 2 | "常服悬金牌""常服带短刀" |
| 戎服 | 1 | "将军戎服直侍左右" |
| 章服/祭服/丧服/公服 | 0 | — |
| 龙袍/袈裟/襕 | 0 | — |
二次检索:针对命中项扩展复合词搜索
- "衣冠|衣甲|衣裘|冬衣|朝服|花钿|绣衣|纻丝|绣袍|便服|鹖冠|皮冠|袍|只孙|乌纱|束带|绣春|盔|甲|铠"等
Step 4: 关键行提取
对命中的行号执行 sed -n 提取上下文(每次≤5行),确认服饰语义:
- 行62-63:颁衣裘制度 ✓
- 行172:鹖冠 ✓
- 行251-252:减冬衣 ✓
- 行275-286:北周甲胄服色(核心段落)✓
- 行327:花钿绣衣 ✓
- 行486-496:宋制门禁衣制 ✓
- 行602-620:明代甲胄(最大段落)✓
- 行688-690:缀衣 ✓
- 行698:衣冠(金日磾传)✓
- 行704:白衣领队 ✓
- 行708:朱衣直阁 ✓
- 行727:皂绨袍 ✓
- 行734:短褐/龙章(文学引用)✓
- 行738:襌衣/大冠/衣罽/五色袍 ✓
Step 5: 分类整理
按主题分为6大类:
1. 侍卫冬夏衣裘制度(汉)
2. 北周侍卫甲胄服色制度(最系统)
3. 唐代千牛卫服饰
4. 明代侍卫甲胄服饰(最详尽)
5. 散见服饰条目
6. 总结表格
Step 6: 保存三份文件
- 官常典侍卫部_总结.md(分类总结+分析)
- 官常典侍卫部_日志.md(本文件)
- 官常典侍卫部_原文提取.md(原文引文汇编)
关键发现
- 服饰内容以甲胄戎服为主:本书为侍卫制度专史,服饰附属于军事仪制,非独立服饰论述
- 北周六率服色制度最系统:元青朱黄皓元六色循环配五行,袍服纹样按等级区分(师子/兽/豹/鹖)
- 明代甲胄类型最丰富:金盔甲/明盔甲/红盔青甲/红皮盔戗金甲/红皮盔描银甲/凤翅盔锁子甲等6+种
- 锦衣卫服饰制度最细:绣春刀、鹅帽只孙皂靴、红纻丝纱罗衣、衬甲服色换给制度等
- 日常服饰信息极少:几乎无民间或朝常服饰,仅有零散衣冠、襌衣等记述
- "领"字77条全为非服饰义:"统领""领掌""带领"等,无一为"衣领"义,grep验证必要
踩坑记录
- "领"字命中77条为最高,但全为"统领""领掌"等军事用语,非衣领——说明简单关键词计数不可靠,必须验证语义
- "衣"字41条中大量为"衣冠子弟""衣色""衣便服"等简短提及,独立服饰段落极少
- "袍"字仅3条,但北周段落中有"绣袍""锦袍""师子文袍""兽文袍""豹文袍""鹖文袍"等多种袍服,因它们出现在同一段落(行286),单字计数低估了信息密度
- 明代甲胄段落极长(行602-620),信息密度高但需精简提取
审核结果
全部通过 ✅ — 原文均从grep检索提取,有明确行号对应,未加载整本TXT文件。