唐诗品汇唐诗拾遗 服饰内容提取日志

基本信息

处理流程

Step 1: wc统计

17852 1710421 唐诗品汇唐诗拾遗.txt

Step 2: 5轮grep检索

轮次关键词类型匹配行数
第1轮核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领)2,133
第2轮材质复合词98
第3轮色彩+服饰复合词55
第4轮制度词20
第5轮配饰词146

Step 3: 精确复合词筛选

使用约150个复合服饰词汇进行二次筛选,得到469行精确匹配。

Step 4: 价值度评分筛选

因匹配行数较多,引入价值度评分系统(0-3分):

评分标准:

Step 5: 分类整理

核心条目按5大类分类,详见总结文档。

筛选标准说明

  1. "衣冠":仅保留同时含其他服饰词的条目或具体朝仪描写
  2. "布衣":仅保留描写具体穿着场景的用法
  3. "霓裳":单独出现作文学意象不收,与具体服饰词共现则收录
  4. 赐衣/赐紫/赐锦:全部收录,为重要制度记载
  5. 金紫/银青/金鱼/银鱼:全部收录,为唐代品官服饰制度

问题与备注

  1. 文本含大量评注(刘云、谢云等),需区分原文与评注
  2. 部分诗人生平介绍含服饰制度信息(如"赐紫禅师")
  3. "火浣单衣绣方领茱萸锦带玉盘囊"为全书最具名物价值条目
  4. 越罗(3条)、蜀锦等地方性丝织品需关注