《交谊典傲慢部》服饰提取日志

一、操作流程记录

步骤 操作 结果
1 wc -c 查文件大小 29,968字节
2 创建输出目录 /home/z/my-project/upload/p1output/交谊典傲慢部/
3 第一轮grep:衣裳冠冕巾帽袍衫裙裘带佩履舄靴 命中:衣15、冠6、履4、巾1、带2、帽1、袍1、裙1、衫1、靴1
4 第二轮grep:服色舆服冠服章服朝服祭服丧服吉服常服公服 命中:冠服1、戎服2
5 第三轮grep:丝帛绢锦绮绫罗缎绸缂丝葛麻布褐 命中:锦1、纻1;排除误命中(葛=诸葛亮, 罗=姓氏)
6 第四轮grep:紫袍绯袍绿袍赐紫赐绯鱼袋笏幞头金带玉带 无命中
7 第五轮grep:旂旗章珮环玦簪钗钿翠珠玉 命中:钗1、环1;排除误命中(环=环卫官)
8 Python精确提取上下文 提取48处原始命中
9 对抗式审查 排除6处误命中,确认25条有效记录
10 分类整理 A服制5/B日常11/C动作6/D配饰3
11 生成三篇MD 完成

二、关键词命中统计

五轮关键词命中明细

第一轮(基础服饰词)
| 关键词 | 原始命中 | 有效命中 | 排除原因 |
|--------|----------|----------|----------|
| 衣 | 15 | 12 | "衣冠"合算1处、"布衣"合算1处 |
| 冠 | 6 | 3 | "弱冠"3处=成年礼,非帽子 |
| 履 | 4 | 2 | "非礼勿履""必履泰山之安"=踩踏 |
| 巾 | 1 | 1 | — |
| 带 | 2 | 1 | "带二江"=带领 |
| 帽 | 1 | 1 | — |
| 袍 | 1 | 1 | — |
| 裙 | 1 | 1 | — |
| 衫 | 1 | 1 | — |
| 靴 | 1 | 1 | — |
| 裘 | 0 | 0 | — |
| 裳 | 0 | 0 | — |
| 冕 | 0 | 0 | — |
| 佩 | 0 | 0 | — |
| 舄 | 0 | 0 | — |

第二轮(制度服饰词)
| 关键词 | 原始命中 | 有效命中 | 排除原因 |
|--------|----------|----------|----------|
| 冠服 | 1 | 1 | — |
| 戎服 | 2 | 2 | — |
| 服色/舆服/章服/朝服/祭服/丧服/吉服/常服/公服 | 0 | 0 | — |

第三轮(织物材料词)
| 关键词 | 原始命中 | 有效命中 | 排除原因 |
|--------|----------|----------|----------|
| 锦 | 1 | 1 | 宫锦袍 |
| 纻 | 1 | 1 | 红纻窄衫 |
| 葛 | 2 | 0 | 均为"诸葛亮"姓名 |
| 罗 | 2 | 0 | 均为"罗给事隐"姓氏 |

第四轮(品级服饰词)
| 关键词 | 原始命中 | 有效命中 |
|--------|----------|----------|
| 全部 | 0 | 0 |

第五轮(配饰词)
| 关键词 | 原始命中 | 有效命中 | 排除原因 |
|--------|----------|----------|----------|
| 钗 | 1 | 1 | 荆钗 |
| 环 | 1 | 0 | "环卫官"非配饰 |

补充识别关键词(非词库内但实际命中)

关键词 命中数 说明
1 岸帻(推头巾)
1 高屐(高底木屐)
1 素氅衣(大氅)
1 解绶(官印丝带)
车服 1 舆服制度术语

三、误命中排除清单

序号 关键词 原文片段 排除理由
1 "非礼勿履" 履=踩踏,非鞋
2 "必履泰山之安" 履=踩踏,非鞋
3 "带二江之双流" 带=带领,非腰带
4 "环卫官" 环=环卫,非佩饰
5 "罗给事隐" 罗=姓氏,非织物
6 "诸葛亮" 葛=姓名用字,非织物

四、文件结构

服饰内容集中于纪事杂录两部分。

五、质量声明