人谱

《人谱》服饰内容提取日志

一、基本信息

二、关键词搜索统计

关键词 命中数 服饰意义命中 噪声命中 有效率
84 38 46 45%
64 28 36 44%
38 22 16 58%
24 8 16 33%
衣冠/冠服 18 16 2 89%
14 5 9 36%
13 4 9 31%
11 4 7 36%
丧服/祭服/朝服/布衣 11 9 2 82%
袍/绣/锦/丝 12 6 6 50%
7 7 0 100%
5 2 3 40%
4 2 2 50%
3 2 1 67%
3 2 1 67%
1 0 1 0%
2 2 0 100%
深衣 1 1 0 100%
合计 285 143 142 50%

三、去噪判定

噪声类型及数量

  1. "服"作"信服/服从/服膺/服用"(约20条):叹服、愧服、心服、服善、服膺等——大量出现在人谱类记中描述人对人的尊敬
  2. "衣"作泛指"衣食"(约15条):衣食足、衣食不备等——生活泛称而非服饰专论
  3. "冠"作"冠军/冠时/弱冠"(约8条):弱冠(L265)、冠时(L544)等——年龄或程度义
  4. "布"作"分布/宣布/布被/布被之讥"(约10条):布被(L284,L478)部分有效,宣布、遍布无效
  5. "带"作"地带/连带/带领"(约9条):带经而锄(L318)为佩带经书(有效),其余多非服饰
  6. "履"作"践履/履历"(约7条):践履(L47)、履阈(L73,有效)、取履焚之(L453,有效)
  7. "饰"作"修饰/掩饰/矫饰"(约9条):饰伪(L87,L287)、矫饰(L285)等——伪饰义而非服饰
  8. "帛"作"钱帛/财帛"(约3条):得钱帛(L241)、帛固多(L508)、尺帛(L243)

有效去噪原则

四、提取方法

  1. 逐关键词grep -n获取行号及上下文
  2. 对84+64+38=186个高命中关键词逐一审读
  3. 按"纪过格"与"类记"两大板块归类
  4. 类记再按篇目(体独、知几、定命、凝道、考旋、作圣)细分
  5. 最终按服饰主题(冠服制度、布衣身份、节俭、孝行、佩饰等)重组

五、提取覆盖率