《皇极典皇极总部》服饰内容提取 · 日志


Step 1:文件验证

wc -l → 156行,29,943字节,未超限

Step 2-8:7轮grep扫描

轮次 关键词数 命中词数 命中条数 零命中词
1 核心服饰词 26 7 14 裳弁帻巾帽舄鞋靴袜带佩笏绶袍衫裙袴褐襦袂
2 等级制度词 14 0 0 全部
3 丝织材料词 16 2 2 丝帛绢缎绫锦绮纱缯缟纨绢帛丝帛绫罗
4 毛皮棉麻词 11 2 3 褐毡罽棉葛苎絺绤布衣
5 装饰纹样词 12 5 13 黼黻刺绣纹华虫藻粉米
6 冠服制度词 11 0 0 全部
7 动作制度词 10 0 0 全部

合计:90关键词,命中16词,约32条命中

Step 9:补充grep复合词

发现冕旒、黈纩、垂衣、甲冑、皂衣、脱簪、衣袽、脱屣、织女等9个有效复合词

Step 10:上下文提取

对13个命中行号执行sed提取,合并后4段上下文块,总量远小于1M

Step 11:噪音过滤

排除10类噪音:履(动词5处)、龙(非纹样7处)、凤/火/山(天文)、罗(动词)、绸缪(复合词)、麻(隐喻)、冠首(比喻)、缵禹旧服(职事义)

最终保留12条有效服饰条目

关键发现

  1. 服饰内容极为稀少,7轮90关键词仅保留12条有效条目
  2. 二、六、七轮共35词全部零命中,本书完全不含系统服制记载
  3. 所有服饰内容均出自箴铭赋颂修辞,非制度性专述
  4. 第145行为核心命中行,含6个有效条目

踩坑记录

  1. 文本超长行格式,单行超过2000字
  2. "履""服"grep命中率高但噪音率也高,必须逐条审查
  3. "罗""绸"等丝织词在本书中均为非服饰义项

审核结果

✅ 全部12条有效服饰条目均有原文依据,行号准确,无编造内容;噪音项已逐一标注排除理由