御定佩文韵府——服饰内容提取日志

基本信息

操作记录

第1步:wc -l

第2步:10轮关键词搜索(Python二进制读取方式,避免编码错误)

轮次 关键词 命中次数 首现行号
R1 舆服 1,104 L156
R1 冠服 37 L4507
R1 章服 43 L4078
R2 赐紫 36 L201
R2 赐绯 35 L3170
R2 朝服 243 L1063
R2 祭服 58 L1770
R3 衮服 17 L4295
R3 衮冕 82 L2288
R3 黼黻 114 L263
R4 佩玉 155 L96
R4 佩璜 6 L13710
R4 玉佩 145 L158
R5 1,167 L111
R5 468 L136
R5 675 L236
R6 冕旒 65 L2149
R6 1,755 L60
R6 751 L143
R7 1,105 L167
R7 647 L259
R7 320 L1510
R8 3,336 L44
R8 382 L744
R8 566 L517
R9 212 L487
R9 834 L375
R9 1,941 L115
R10 4,599 L110
R10 814 L164
R10 463 L17

第3步:补充搜索高区分度术语

关键词 命中次数 首现行号
步摇 10 L818
冠笄 12 L5521
翟衣 17 L3332
袆衣 26 L755
鞠衣 24 L3330
褕翟 5 L15753
阙翟 5 L9449
大带 39 L4296
蔽膝 37 L1488
绶带 25 L4090
鱼袋 22 L3170
品服 21 L12084
服色 68 L1409
885 L164
458 L206

第4步:内容提取

第5步:筛选与审查

注意事项

  1. 本文件62MB极巨大,严禁整本加载,全程使用Python二进制读取+行号定位
  2. 韵书体例致同一术语可能出现在非服饰语境中(如"冠服"出现在"九州图"条中实为"冠服不同"的王会图典故)
  3. 部分行命中但实际内容与服饰无直接关系(如"大带"在L5857实为"鞋带"),已人工审查剔除