悦心集 服饰内容提取日志

基本信息

处理流程

Step 1: wc统计

822行 47237字节

文件较小,可全量grep+sed处理。

Step 2: 五轮grep -c统计

轮次关键词类别匹配行数
1核心词21
2材质17
3色彩纹饰82
4制度1
5配饰5

Step 3: 详细grep + sed提取

第1轮:核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领)

初步匹配21行,筛选后服饰相关15行:

排除项(非服饰含义):

第2轮:材质(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧)

初步匹配17行,筛选后服饰相关3行:

排除项:

第3轮:色彩纹饰(紫绯朱赭青绿白玄黄丹素绣纹章黼黻华)

初步匹配82行,大量为自然景物描写,筛选后服饰相关仅2行:

排除项(典型非服饰匹配):

第4轮:制度(服赐赐服赐紫赐绯品色舆服章服冠服朝服祭服丧服常服加冠衮)

匹配1行:

第5轮:配饰(簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼)

匹配5行,筛选后服饰相关1行:

排除项:

Step 4: 筛选结果

经5轮检索+人工审查,共筛选出服饰相关条目20条,分为6类:

  1. 冠服制度类 2条
  2. 常服类 5条
  3. 鞋履类 2条
  4. 官服象征类 2条
  5. 文学修辞类 6条
  6. 佛教服饰意象 3条

Step 5: 审查备注