交谊典品题部 — 服饰提取日志

基本信息

项目 内容
输入文件 /home/z/my-project/upload/part1_extracted/交谊典品题部.txt
文件大小 226,188 字节
总行数 2,853 行
行最长字符 约2,439 字符(超长行,古籍合行特征)
输出目录 /home/z/my-project/upload/p1output/交谊典品题部/

五轮关键词扫描

第一轮:基础服饰词(衣裳冠冕巾帽袍衫裙裘带佩履舄靴)

关键词 命中数 有效服饰 说明
10 6 布衣×5、褒衣×1;误:被衣(人名)
1 0 黄裳为人名
6 3 弱冠、冠栉、冠玉;误:冠世(比喻)
3 1 轩冕之服;误:师冕(人名)、父冕(人名)
4 1 欲沾巾;误:字从巾/音所巾反(注音)
1 1 脱帽
1 1 袍仗精整
0 0
0 0
3 2 裼裘、衣羊裘;误:乐正裘(人名)
6 1 褒衣无带;误:赵叔带/王子带(人名)、不绝如带(比喻)
2 1 舍玦佩;误:心佩其训(比喻)
6 0 全部为比喻用法(履信、履道等)
0 0
1 1 着靴行旷野
小计 50 18 有效率36%

第二轮:制度服饰词(服色舆服冠服章服朝服祭服丧服吉服常服公服)

关键词 命中数 有效服饰 说明
朝服 1 0 "吴朝服其弘量"中朝服=朝廷佩服,非服饰
其他 0 0
小计 1 0 有效率0%

第三轮:织物材料词(丝帛绢锦绮绫罗缎绸缂丝葛麻布褐)

关键词 命中数 有效服饰 说明
3 2 琴上丝、状若丝缕;1条为比喻
1 1 缯帛(比喻)
3 2 锦绣、锦衣玉食
1 0 巧言绮粲(形容言辞,非织物)
11 1 入罗红颜;误:武罗(人名)、网罗等
2 1 白绸;误:绸缪(成语)
13 0 全部为人名/地名(葛天氏、诸葛等)
1 1 披麻(丧服)
11 5 布衣×5;误:姑布(人名)、宣布等
1 1 布褐
其他 0 0
小计 46 14 有效率30%

第四轮:品级服饰词(紫袍绯袍绿袍赐紫赐绯鱼袋笏幞头金带玉带)

关键词 命中数 有效服饰 说明
全部 0 0 无命中
小计 0 0

第五轮:配饰礼仪词(旂旗章珮环玦簪钗钿翠珠玉)

关键词 命中数 有效服饰 说明
1 0 人名(薛应旗)
28 0 全部为人名(万章等)或文章/章句
5 0 环植(非佩环)
2 1 舍玦佩;另1条为人名(耶律玦)
2 1 珥簪;另1条为比喻(岭树如簪)
1 0 翠羽雀(鸟名)
6 2 舍珠瑱、明珠杂玑贝
17 1 冠玉;其余为人名(蘧伯玉等)
其他 0 0
小计 62 5 有效率8%

汇总

轮次 关键词数 命中总数 有效数 有效率
第一轮 15 50 18 36%
第二轮 10 1 0 0%
第三轮 14 46 14 30%
第四轮 10 0 0
第五轮 12 62 5 8%
合计 61 159 27 17%

注:合计命中数含跨轮重复命中同一行同一关键词,去重后有效记录27条。

处理过程

  1. wc -c 确认文件大小 226,188 字节
  2. 五轮 grep -n 扫描,记录行号与关键词
  3. Python 脚本提取命中关键词前后各40字符上下文
  4. 逐条人工审查,区分:人名误命、比喻用法、注音标注、真实服饰
  5. 合并同行多条记录,扩展上下文至合理长度
  6. 按9大分类归档,生成三MD输出

审查要点