全唐词·服饰整理日志

整理时间:2026-03-05
任务描述:对《全唐词》txt进行服饰关键词逐本整理,输出总结、日志、原文提取三份MD


操作流程

第1步:文件基本信息确认

第2步:第一轮grep——全量服饰关键词扫描

第3步:第二轮grep——稀有/专有服饰关键词

第4步:第三轮grep——特定服饰组合词

第4.5步:第四轮grep——常见服饰组合

第5步:第五轮grep——妆容饰物专项

第6步:分类整理

将726行匹配结果按以下主题分类:
1. 衣裳制度(袍、衫、襦、裙等)——约80条
2. 冠弁配饰(冠、簪、钗、钿、步摇等)——约90条
3. 纺织材料(锦、罗、绫、纱、丝等)——约150条(含大量"丝"泛指)
4. 妆容饰物(画眉、花黄、花钿、扇等)——约50条
5. 服饰故事(征衣、寒衣、霓裳、金缕衣等)——约40条
6. 隐逸仙道服饰(蓑衣、荷衣、羽衣等)——约20条

第7步:撰写三份MD


关键发现

  1. "丝"为最高频词但多为比喻:柳丝、琴丝、情丝等,真正纺织用丝仅少量,需人工甄别。
  2. 罗为唐词第一织物:罗衣、罗裙、罗衫、罗袖、罗幕、罗帏等组合极多,反映唐罗织物之盛。
  3. 征衣寒衣为独立主题群:从闺怨到边塞,形成完整的"寄衣→捣衣→寒衣"叙事链。
  4. 步摇为唐贵妇标志性头饰:多处出现"步摇金""玉步摇""步摇珠翠"。
  5. 金缕衣借服喻时:杜秋娘"劝君莫惜金缕衣"以华服喻年华,为唐词服饰哲学巅峰。
  6. 敦煌词服饰描写质朴:L6875-L6963段敦煌曲子词中"锦衣公子""浑身挂绮罗装束"等描写与文人词风格迥异。
  7. 道教服饰自成体系:星冠、羽衣、霞帔、莲冠等形成独立仙道服饰谱系。

关键踩坑记录

  1. "丝"字噪音极大:grep匹配"丝"返回大量柳丝、琴丝等非服饰用例,必须在分类时人工过滤。
  2. "罗"字兼具织物与网罗义:如"网罗高树巅"(L694)非服饰用例,需甄别。
  3. "环"字多指环形非饰物:如"玉环"可为地名或器形,非必为耳环手环。
  4. "扇"字多非服饰:歌扇、画扇、团扇虽为随身之物但属器物而非严格服饰,本整理仍收录。
  5. "电风扇"为OCR错误:L9094、L9218、L9380中"电风扇"明显为OCR乱码,应忽略。
  6. "带"字过于宽泛:大量"一带""带恨""带笑"非服饰带,仅"裙带""绶带""罗带""金带"等为服饰用例。

审核结果