《对联话》服饰提取日志

Step 1:文件基本信息

Step 2:关键词grep定位

第一轮:冠服类关键词

第二轮:佩饰/材质/制度关键词

第三轮:精确关键词补充

Step 3:噪音过滤

Step 4:有效服饰条目筛选

经三轮grep及逐行审核,确认有效条目约53处: - 冠服类:15处(含衣冠、冕旒、华衮、弓裘、短衣等) - 佩饰类:6处(环珮、簪缨、巾扇、缨等) - 靴履类:3处(赐履、卖履、穿靴) - 材质类:5处(绨、锦、布) - 染色类:3处(缁、白、锦) - 制度类:6处(衣冠华夏、衣冠冢、冕旒朝觐等) - 动作词:7处(赐、正、缝、佩、戴等) - 典故:8处(弓裘、绨袍、缁衣、羊裘、狐裘、优孟衣冠等)

Step 5:产出文件

踩坑记录

  1. 本书1248行,为四书中最长,grep命中率极高但噪音比也最高
  2. “衣冠”一词在本中出现约8次,语义层次复杂(实物→制度→身份→比喻),需逐条区分
  3. “冠冕堂皇”已从实物转为形容词语,但词源确为冠冕礼帽,应收录
  4. “绨袍”出现两次(行158关帝庙联、行360关帝庙联),为同一典故的不同引用
  5. “卖履”出曹操遗令,看似与服饰无关,实则涉及鞋履商贸,保留
  6. “优孟衣冠”为戏装概念,涉及服饰与身份模仿的哲学关系
  7. “白衣冠”为丧服民俗,本书唯一涉及丧服制度的条目

审核确认