《对联话》服饰提取日志
Step 1:文件基本信息
- 文件路径:/home/z/my-project/upload/对联/对联/对联话.txt
- 总行数:1248行
- 文件性质:清·吴恭亨撰,联话体裁著作,录历代对联及评论
Step 2:关键词grep定位
第一轮:冠服类关键词
- 命令:rg -n “冠|冕|弁|帻|巾|帽|幞|袍|衫|袄|褐|裘|襦|褂|深衣|朝服|祭服|衮服|章服”
- 命中行数:约40行
- 有效命中:弓裘(行71)、冠冕(行109)、高帽(行109)、衣冠沦异族(行135)、衣冠冢(行166)、华衮(行220)、正其衣冠(行220)、缁衣(行238)、冕旒(行289、420)、短衣(行210)、绨袍(行158、360)、羊裘(行289)、狐裘(行580)、巾扇(行562)、优孟衣冠(行1056)、穿靴戴顶(行1226)
第二轮:佩饰/材质/制度关键词
- 命令:rg -n “佩|绶|笏|玉带|金带|犀带|珮|履|舄|靴|鞋|袜|丝|帛|绢|绫|罗|绸|缎|锦|绮|纱|麻|葛|布|棉|染|服色|舆服|冠服|赐服|品色|丧服”
- 命中行数:约50行
- 大量噪音:罗列、丝竹、绸缪等非服饰用法
第三轮:精确关键词补充
- 命令:rg -n “衣冠|绨袍|弓裘|锦衣|狐裘|羊裘|簪缨|冕旒|华衮|缝衣|赐履|衫尘|缁衣|巾扇|布帆|绣鞋|环珮”
- 命中行数:约20行,命中率最高
Step 3:噪音过滤
- “冠”字噪音:”名冠诸侯”(居首,非冠帽);”冠盖多”(车盖,非冠帽)
- “衣”字噪音:”穿衣吃饭”(日常用语);”衣被苍生”(比喻恩泽);”锦里春风”(锦里为地名)
- “佩”字噪音:”佩鄂国至言”(铭记,非佩戴);但词源为佩戴,保留
- “缨”字噪音:”濯足濯缨”为《沧浪之水》典故,缨为帽带,确为服饰
- “锦”字噪音:”锦绣江山”“锦障如林”已转为比喻义,保留但注明
- “布”字噪音:”布帆”为船帆,非直接服饰,但为布质织物,保留
- 颜色词噪音:大量颜色词为自然景物描写,已排除
Step 4:有效服饰条目筛选
经三轮grep及逐行审核,确认有效条目约53处: - 冠服类:15处(含衣冠、冕旒、华衮、弓裘、短衣等) - 佩饰类:6处(环珮、簪缨、巾扇、缨等) - 靴履类:3处(赐履、卖履、穿靴) - 材质类:5处(绨、锦、布) - 染色类:3处(缁、白、锦) - 制度类:6处(衣冠华夏、衣冠冢、冕旒朝觐等) - 动作词:7处(赐、正、缝、佩、戴等) - 典故:8处(弓裘、绨袍、缁衣、羊裘、狐裘、优孟衣冠等)
Step 5:产出文件
- 对联话_原文提取.md ✅
- 对联话_总结.md ✅
- 对联话_日志.md ✅(本文件)
踩坑记录
- 本书1248行,为四书中最长,grep命中率极高但噪音比也最高
- “衣冠”一词在本中出现约8次,语义层次复杂(实物→制度→身份→比喻),需逐条区分
- “冠冕堂皇”已从实物转为形容词语,但词源确为冠冕礼帽,应收录
- “绨袍”出现两次(行158关帝庙联、行360关帝庙联),为同一典故的不同引用
- “卖履”出曹操遗令,看似与服饰无关,实则涉及鞋履商贸,保留
- “优孟衣冠”为戏装概念,涉及服饰与身份模仿的哲学关系
- “白衣冠”为丧服民俗,本书唯一涉及丧服制度的条目
审核确认
- 所有引用原文均带行号,可溯源验证
- 噪音已充分过滤,三轮grep确保覆盖率
- 总结中对抗式审查已完成5项质疑与回应
- 本书为四书中服饰信息最丰富者,已标注与前三书的本质差异