《交谊典居停部》服饰提取日志
操作流程
步骤1:文件检视
- 命令:
wc -c 交谊典居停部.txt
- 结果:26,990 字节,82行
- 输出目录已创建:
/home/z/my-project/upload/p1output/交谊典居停部/
步骤2:五轮词库grep逐轮扫描
第1轮:基础服饰词(衣裳冠冕巾帽袍衫裙裘带佩履舄靴)
- 命令:
rg -n '衣|裳|冠|冕|巾|帽|袍|衫|裙|裘|带|佩|履|舄|靴'
- 命中行:31, 33, 37, 39, 79, 81
- 有效关键词:衣、冠、冕、巾、帽、袍、裘、履
- 未命中:裳、衫、裙、带、佩、舄、靴
第2轮:服色类(服色舆服冠服章服朝服祭服丧服吉服常服公服)
- 命令:
rg -n '服色|舆服|冠服|章服|朝服|祭服|丧服|吉服|常服|公服'
- 结果:零命中
第3轮:面料类(丝帛绢锦绮绫罗缎绸缂丝葛麻布褐)
- 命令:
rg -n '丝|帛|绢|锦|绮|绫|罗|缎|绸|缂|葛|麻|布|褐'
- 命中行:28, 33, 37, 39
- 有效关键词:帛、锦、葛、布
- 误命中:罗(罗金山为人名)、葛(旄丘之葛为植物,非面料;但葛衣为面料)
- 注:缣虽不在词库中,但作为面料词出现于行37
第4轮:官服类(紫袍绯袍绿袍赐紫赐绯鱼袋笏幞头金带玉带)
- 命令:
rg -n '紫袍|绯袍|绿袍|赐紫|赐绯|鱼袋|笏|幞头|金带|玉带'
- 命中行:39
- 有效关键词:赐紫(赐紫方袍)
- 误命中:笏("银一笏"为银锭计量单位,非朝笏服饰)
- 未命中:紫袍、绯袍、绿袍、赐绯、鱼袋、幞头、金带、玉带
第5轮:饰品旗帜类(旂旗章珮环玦簪钗钿翠珠玉)
- 命令:
rg -n '旂|旗|章|珮|环|玦|簪|钗|钿|翠|珠|玉'
- 命中行:33, 39, 79
- 有效关键词:珠(明珠、珠冠)
- 误命中:
- 章(10次):均为章节编号或人名(章献太后、章惇、字元章),非章服
- 环(1次):"环列"为围列义,非环佩饰品
- 翠(1次):"撷翠"为采摘绿色蔬果,非翠羽饰品
- 玉(5次):蘧伯玉为人名(3次)、搜玉为书名、堆金迭玉为食物比喻
- 未命中:旂、旗、珮、玦、簪、钗、钿
步骤3:sed提取命中文行及上下文
- 使用python读取命中文行并提取关键词上下文(±30-60字)
- 共提取6个行号的服饰相关段落
步骤4:分类整理
- 按衣类、冠帽类、足衣类、礼制服饰、面料类、饰品类六大分类
- 整理出14条有效服饰记录
步骤5:审查去重
- 剔除6个误命中关键词(罗、笏、章、环、翠、玉)
- 合并同一出处重复记录(如乌巾出现2次合并为1条)
- 最终确认14个有效关键词类型、14条服饰记录
步骤6:生成三MD文件
- 交谊典居停部_总结.md
- 交谊典居停部_日志.md
- 交谊典居停部_原文提取.md
↑