交谊典宾主部 · 服饰提取日志
操作流程
第一步:文件检测
- 命令:
wc -c 交谊典宾主部.txt
- 结果:118,652 字节
- 判断:约118KB,非小文件,需分步grep,严禁整本载入
第二步:五轮词库检索(grep -n)
第一轮:基础服饰词
- 关键词:
衣裳|冠冕|巾帽|袍衫|裙裘|带佩|履舄|靴
- 命中行:L28、L236
- 命中词:衣裳(L28)、冠冕(L236)
第二轮:制度服饰词
- 关键词:
服色|舆服|冠服|章服|朝服|祭服|丧服|吉服|常服|公服
- 命中行:L197、L222
- 命中词:朝服(L197×2, L222)、吉服/丧服(L141)
第三轮:织物材料词
- 关键词:
丝帛|绢锦|绮绫|罗缎|绸缂|丝葛|麻布|褐
- 命中行:无直接命中
第四轮:品阶服饰词
- 关键词:
紫袍|绯袍|绿袍|赐紫|赐绯|鱼袋|笏|幞头|金带|玉带
- 命中行:无命中
第五轮:旂旗佩饰词
- 关键词:
旂旗|章珮|环玦|簪钗|钿翠|珠玉
- 命中行:L197(珠玉、玳瑁簪)
第三步:扩展单字检索
- 对首轮词拆字扩展:
衣|裳|冠|冕|巾|帽|袍|衫|裙|裘|带|佩|履|舄|靴
- 新增命中行:L45, L49, L66, L94, L96, L137, L141, L148, L198
- 对织物词扩展:
帛|绢|锦|绮|绫|罗|缎|绸|缂|葛|麻|布|褐|丝
- 新增命中行:L197(罗纨/绮縠/束帛/纻衣), L24(绢)
- 对佩饰词扩展:
笏|幞|珠|玉|簪|钗|钿|翠|环|珮
- 新增命中:L197(玳瑁簪/珠玉饰之/珠履)
第四步:sed上下文提取
- 对所有命中行执行
grep -oP 提取前后各30-50字上下文
- 逐条确认服饰语义,排除误命中
第五步:审查去误
- 排除"冠盖"(车盖非冠帽)— L197出现"冠盖相属",不录
- 排除"布衣交"之"布衣"泛指平民身份,仅录作身份标记
- 排除"执玉"(礼仪动作,非佩玉描写)
- "玉藻"为《礼记》篇名引述,不录为佩玉
- "衣破衣"中"衣"为动词"穿"义+名词,保留
- "解衣之暇"中"解衣"非服饰描写,排除
第六步:生成三MD
- 交谊典宾主部_总结.md(本文件同系列)
- 交谊典宾主部_日志.md(本文件)
- 交谊典宾主部_原文提取.md
↑