《交谊典恩雠部》服饰提取日志

操作流程记录

步骤1:文件大小检查(wc -c)

步骤2:创建输出目录

步骤3:五轮词库 grep -n 筛查

第一轮:基础服饰词

第二轮:制度服饰词

第三轮:面料材质词

第四轮:官服等级词

第五轮:器饰珍宝词

步骤4:sed 精细处理

步骤5:分类整理

将35条有效记录分为10个类别:
1. 冠冕头饰(3条)
2. 衣裳袍服(9条)
3. 裙裳下服(1条)
4. 丧服制度(1条)
5. 官服等级(7条)
6. 佩饰配件(5条)
7. 鞋履(2条)
8. 丝织品(4条)
9. 甲胄旗帜(2条)
10. 衣冠习俗(1条)

步骤6:审查去重

步骤7:生成三MD文件

筛除明细

误命中关键词 行号 原文片段 排除原因
109 冠世伟才 "冠"作"冠绝"解,非冠帽
127 白玉四环 "环"为器物,非服饰环佩
176 姑蔑之旗 军旗,非服饰旗章
176 子女玉帛 财物统称,非服饰玉佩
127 丝布 已计入丝布条
多处 佩带/地带 多为动词或地理
118 尾堪履 动词"踩踏"义
109 佩带芳 已计入佩带条
127 明珠一寸 珍宝,非服饰珠饰
118 翠羽装剑鞘 已计入翠羽条

输出文件清单

文件名 内容 约计大小
原文提取.md 35条原文记录及出处 ~6KB
交谊典恩雠部_总结.md 分类统计与分析 ~5KB
日志.md 操作流程记录 ~4KB

关键统计


日志完成时间:2024年操作记录
操作原则:严禁整本载入、禁编造、无服饰须明说