交谊典品题部 — 服饰提取日志
基本信息
| 项目 |
内容 |
| 输入文件 |
/home/z/my-project/upload/part1_extracted/交谊典品题部.txt |
| 文件大小 |
226,188 字节 |
| 总行数 |
2,853 行 |
| 行最长字符 |
约2,439 字符(超长行,古籍合行特征) |
| 输出目录 |
/home/z/my-project/upload/p1output/交谊典品题部/ |
五轮关键词扫描
第一轮:基础服饰词(衣裳冠冕巾帽袍衫裙裘带佩履舄靴)
| 关键词 |
命中数 |
有效服饰 |
说明 |
| 衣 |
10 |
6 |
布衣×5、褒衣×1;误:被衣(人名) |
| 裳 |
1 |
0 |
黄裳为人名 |
| 冠 |
6 |
3 |
弱冠、冠栉、冠玉;误:冠世(比喻) |
| 冕 |
3 |
1 |
轩冕之服;误:师冕(人名)、父冕(人名) |
| 巾 |
4 |
1 |
欲沾巾;误:字从巾/音所巾反(注音) |
| 帽 |
1 |
1 |
脱帽 |
| 袍 |
1 |
1 |
袍仗精整 |
| 衫 |
0 |
0 |
— |
| 裙 |
0 |
0 |
— |
| 裘 |
3 |
2 |
裼裘、衣羊裘;误:乐正裘(人名) |
| 带 |
6 |
1 |
褒衣无带;误:赵叔带/王子带(人名)、不绝如带(比喻) |
| 佩 |
2 |
1 |
舍玦佩;误:心佩其训(比喻) |
| 履 |
6 |
0 |
全部为比喻用法(履信、履道等) |
| 舄 |
0 |
0 |
— |
| 靴 |
1 |
1 |
着靴行旷野 |
| 小计 |
50 |
18 |
有效率36% |
第二轮:制度服饰词(服色舆服冠服章服朝服祭服丧服吉服常服公服)
| 关键词 |
命中数 |
有效服饰 |
说明 |
| 朝服 |
1 |
0 |
"吴朝服其弘量"中朝服=朝廷佩服,非服饰 |
| 其他 |
0 |
0 |
— |
| 小计 |
1 |
0 |
有效率0% |
第三轮:织物材料词(丝帛绢锦绮绫罗缎绸缂丝葛麻布褐)
| 关键词 |
命中数 |
有效服饰 |
说明 |
| 丝 |
3 |
2 |
琴上丝、状若丝缕;1条为比喻 |
| 帛 |
1 |
1 |
缯帛(比喻) |
| 锦 |
3 |
2 |
锦绣、锦衣玉食 |
| 绮 |
1 |
0 |
巧言绮粲(形容言辞,非织物) |
| 罗 |
11 |
1 |
入罗红颜;误:武罗(人名)、网罗等 |
| 绸 |
2 |
1 |
白绸;误:绸缪(成语) |
| 葛 |
13 |
0 |
全部为人名/地名(葛天氏、诸葛等) |
| 麻 |
1 |
1 |
披麻(丧服) |
| 布 |
11 |
5 |
布衣×5;误:姑布(人名)、宣布等 |
| 褐 |
1 |
1 |
布褐 |
| 其他 |
0 |
0 |
— |
| 小计 |
46 |
14 |
有效率30% |
第四轮:品级服饰词(紫袍绯袍绿袍赐紫赐绯鱼袋笏幞头金带玉带)
| 关键词 |
命中数 |
有效服饰 |
说明 |
| 全部 |
0 |
0 |
无命中 |
| 小计 |
0 |
0 |
— |
第五轮:配饰礼仪词(旂旗章珮环玦簪钗钿翠珠玉)
| 关键词 |
命中数 |
有效服饰 |
说明 |
| 旗 |
1 |
0 |
人名(薛应旗) |
| 章 |
28 |
0 |
全部为人名(万章等)或文章/章句 |
| 环 |
5 |
0 |
环植(非佩环) |
| 玦 |
2 |
1 |
舍玦佩;另1条为人名(耶律玦) |
| 簪 |
2 |
1 |
珥簪;另1条为比喻(岭树如簪) |
| 翠 |
1 |
0 |
翠羽雀(鸟名) |
| 珠 |
6 |
2 |
舍珠瑱、明珠杂玑贝 |
| 玉 |
17 |
1 |
冠玉;其余为人名(蘧伯玉等) |
| 其他 |
0 |
0 |
— |
| 小计 |
62 |
5 |
有效率8% |
汇总
| 轮次 |
关键词数 |
命中总数 |
有效数 |
有效率 |
| 第一轮 |
15 |
50 |
18 |
36% |
| 第二轮 |
10 |
1 |
0 |
0% |
| 第三轮 |
14 |
46 |
14 |
30% |
| 第四轮 |
10 |
0 |
0 |
— |
| 第五轮 |
12 |
62 |
5 |
8% |
| 合计 |
61 |
159 |
27 |
17% |
注:合计命中数含跨轮重复命中同一行同一关键词,去重后有效记录27条。
处理过程
wc -c 确认文件大小 226,188 字节
- 五轮
grep -n 扫描,记录行号与关键词
- Python 脚本提取命中关键词前后各40字符上下文
- 逐条人工审查,区分:人名误命、比喻用法、注音标注、真实服饰
- 合并同行多条记录,扩展上下文至合理长度
- 按9大分类归档,生成三MD输出
审查要点
- "布衣"为本部最高频服饰词,5次出现均指平民身份,非服饰制度描述
- "冠""履""佩"等词在本部多为比喻用法,需严格甄别
- 人名含服饰字(赵叔带、王子带、乐正裘等)是最大误命源
- 本部无品级服饰(紫袍、赐紫、鱼袋等)相关内容
- 服饰信息整体密度低,以间接提及为主