二程粹言

《二程粹言》服饰内容提取日志

一、基本信息

二、关键词搜索统计

关键词 命中数 服饰意义命中 噪声命中 有效率
14 6 8 43%
4 3 1 75%
2 2 0 100%
2 2 0 100%
2 1 1 50%
1 0 1 0%
1 1 0 100%
1 0 1 0%
6 0 6 0%
2 1 1 50%
冠服/衣冠 1 1 0 100%
5 1 4 20%
布衣 1 1 0 100%
裳/袍/绣/锦/丝/褐/深衣 0
合计 40 19 21 48%

三、去噪判定

噪声类型及数量

  1. "服"作"服从/信服"(7条):民心服(L904)、服之(L713)、服义(L844)、服循(L932)、服勤厥职(L1539)、服饵致寿(L1703)、服化(L1452)
  2. "带"作"地带/连带"(6条):皆为非服饰用法
  3. "衣"作"衣食"合称(5条):泛指生活而非专论服饰
  4. "履"作"践行"(1条):躬履(L587)、履乎坦途(L585)
  5. "饰"作"修饰/矫饰"(4条):修辞(L333)、簠簋不饰(L892)、饰私智(L1039)、矫饰(L1479)
  6. "佩"作"佩带(非饰品)"(1条):佩玉(L930)有效,其余非服饰
  7. "帛"作"钱帛/财帛"(1条):钱帛归以与兄,帛为财物非衣料
  8. "麻"合称"丝麻"(1条):播种五谷丝麻——丝麻并提,归于衣料(有效)

有效去噪原则

四、提取方法

  1. 逐关键词grep -n获取行号
  2. 对命中行前后文审读判定
  3. 有效命中按卷篇归类
  4. 交叉去重(同一思想在不同卷篇出现,如L375与L594均言"冬裘夏葛")

五、提取覆盖率