《人事典三十一岁至四十岁部》服饰提取日志
操作流程
Step 1:文件信息
- 文件:/home/z/my-project/upload/part1_extracted/人事典三十一岁至四十岁部.txt
- 大小:7,670字节(wc -c)
- 操作:严禁整本载入,仅通过grep逐行扫描
Step 2:词库五轮扫描
R1:基础服饰词(衣裳冠冕巾帽袍衫裙裘带佩履舄靴)
- 命中4行(第7、15、19、44行)
- 第7行:"倾冠侧首"——冠帽歪斜描写情绪,排除
- 第15行:"弱冠精华开"——年龄术语,排除
- 第19行:"二十曰弱冠"——礼记术语,排除
- 第44行:"裹头带巾"——首服穿戴,有效;"冠玉"——冠饰比喻,有效
R2:服制词(服色舆服冠服章服朝服祭服丧服吉服常服公服)
R3:织物词(丝帛绢锦绮绫罗缎绸缂葛麻布褐)
- 命中2行(第7、44行)
- 第7行:"发元绸白"——绸形容发质,排除
- 第44行:"罗□传"——姓氏,排除
R4:品阶服饰词(紫袍绯袍绿袍赐紫赐绯鱼袋笏幞头金带玉带)
R5:器饰词(旂旗章珮环玦簪钗钿翠珠玉)
- 命中2行(第3、44行)
- 第3行:"抽簪高迈"——发簪/去官习俗,有效
- 第44行:"平章事"——官职名,排除
Step 3:分类审查
| 记录 |
关键词 |
分类 |
审查结果 |
| 抽簪高迈 |
簪 |
发饰/官场习俗 |
✅通过 |
| 裹头带巾 |
巾、带 |
首服/日常服饰 |
✅通过 |
| 冠玉 |
冠、玉 |
冠饰/比喻 |
✅通过 |
Step 4:排除项确认
- "弱冠"(第15、19行):年岁术语 → 排除
- "倾冠侧首"(第7行):情绪描写,非服饰 → 排除
- "发元绸白"(第7行):绸喻发质 → 排除
- "罗□传"(第44行):姓氏 → 排除
- "平章事"(第44行):官职 → 排除
- "冠玉"虽为比喻,但以冠帽玉饰为词源,保留
Step 5:输出
- 有效关键词数:4
- 有效记录数:3
- 排除记录数:6
- 三篇MD均≤20KB ✅
↑