《皇极典皇极总部》服饰内容提取 · 日志
- 任务时间:2026-05-17
- 文件信息:156行,29,943字节
Step 1:文件验证
wc -l → 156行,29,943字节,未超限
Step 2-8:7轮grep扫描
| 轮次 | 关键词数 | 命中词数 | 命中条数 | 零命中词 |
|---|---|---|---|---|
| 1 核心服饰词 | 26 | 7 | 14 | 裳弁帻巾帽舄鞋靴袜带佩笏绶袍衫裙袴褐襦袂 |
| 2 等级制度词 | 14 | 0 | 0 | 全部 |
| 3 丝织材料词 | 16 | 2 | 2 | 丝帛绢缎绫锦绮纱缯缟纨绢帛丝帛绫罗 |
| 4 毛皮棉麻词 | 11 | 2 | 3 | 褐毡罽棉葛苎絺绤布衣 |
| 5 装饰纹样词 | 12 | 5 | 13 | 黼黻刺绣纹华虫藻粉米 |
| 6 冠服制度词 | 11 | 0 | 0 | 全部 |
| 7 动作制度词 | 10 | 0 | 0 | 全部 |
合计:90关键词,命中16词,约32条命中
Step 9:补充grep复合词
发现冕旒、黈纩、垂衣、甲冑、皂衣、脱簪、衣袽、脱屣、织女等9个有效复合词
Step 10:上下文提取
对13个命中行号执行sed提取,合并后4段上下文块,总量远小于1M
Step 11:噪音过滤
排除10类噪音:履(动词5处)、龙(非纹样7处)、凤/火/山(天文)、罗(动词)、绸缪(复合词)、麻(隐喻)、冠首(比喻)、缵禹旧服(职事义)
最终保留12条有效服饰条目
关键发现
- 服饰内容极为稀少,7轮90关键词仅保留12条有效条目
- 二、六、七轮共35词全部零命中,本书完全不含系统服制记载
- 所有服饰内容均出自箴铭赋颂修辞,非制度性专述
- 第145行为核心命中行,含6个有效条目
踩坑记录
- 文本超长行格式,单行超过2000字
- "履""服"grep命中率高但噪音率也高,必须逐条审查
- "罗""绸"等丝织词在本书中均为非服饰义项
审核结果
✅ 全部12条有效服饰条目均有原文依据,行号准确,无编造内容;噪音项已逐一标注排除理由