《温凉盏鼓词》服饰提取日志

基本信息

项目 内容
输入文件 /home/z/my-project/upload/剧曲/剧曲/温凉盏鼓词.txt
文件大小 252KB
总行数 676行
输出目录 /home/z/my-project/upload/剧曲output/温凉盏鼓词/
处理时间 2026-03-05

关键词词库

衣、裳、冠、带、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、环、绮、罗、纱、绢、帛、锦、绣、练、絮、布、麻、丝、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛

处理流程

第一轮:文件检查与行数统计

  • 命令:wc -l 温凉盏鼓词.txt
  • 结果:676行,252KB
  • 读取全文确认文件结构:鼓词韵文(【】标记)与散文叙述交替

第二轮:全量关键词搜索

  • 命令:rg -n '[衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛]' 温凉盏鼓词.txt
  • 结果:190行命中

第三轮:分关键词精查

  • :约60行,含衣衾、白衣、衣锦、衣衫、衣袍、衣帽、衣冠、估衣铺等
  • 巾|冠|帽|履|靴|鞋:约30行,含方巾、儒巾、草帽、僧帽、皂履、皂靴、云鞋、棉鞋、朱履、红鞋、麻鞋等
  • 袍|衫|袄|裙|褐|裘:约25行,含衣袍、素白衫、布衫、罗衫、蓝衫、纱衫、貂皮袄、绸袄、棉袄、绣花袄、道袍、蟒袍、红裙、罗裙等
  • 绸|缎|绫|罗|纱|绢|帛|锦|绣|布|麻|丝|缯|纨|绡|绮:约40行,含绸缎铺、绫罗、绫花、绫衫、锦缎、绣龙旗、青布、青缎、苏绫、纱衣、缎子铺、绉绸等
  • 簪|环|珥|佩:约10行,含簪环、金环、银簪、钗环、金钗等
  • 旗|旌|旆|纛:约5行,含旗一杆、绣龙旗、龙旗等
  • 帷|帐|幄:约3行,含床帐
  • 佩|绶|绂|黼|黻|弁|冕|鹖|帻|屦|绅|袂|裾|幅:少量命中,多出现在罗裙八幅、衣襟等组合中

第四轮:噪音过滤

  • 过滤规则:去除仅含"衣"作"衣钵/衣食/衣食住行"等非服饰义用法的行
  • 保留标准:仅保留描述具体服饰品类、穿着行为、面料名称、服饰铺面的段落
  • 过滤后有效行数:约48处独立服饰描写段落

第五轮:上下文提取

  • 使用 sed -n 提取关键行完整内容
  • 对鼓词韵文段落,保留【】标记以区分文体
  • 对关键残缺行(如L124"头戴像异宝"疑似原文缺字)照录存疑

提取统计

类别 提取条目数
丧葬服饰 2
男性人物服饰 9
女性人物服饰 19
街市商铺与面料 3
仪仗旗帜服饰 3
散见服饰词句 7
合计 48

输出文件

文件名 大小 说明
温凉盏鼓词_服饰总结.md ≤20KB 服饰内容分析总结
温凉盏鼓词_服饰原文提取.md ≤20KB 服饰相关原文段落
温凉盏鼓词_服饰提取日志.md ≤20KB 本处理日志

存疑记录

  1. L124 "头戴像异宝"——原文疑有缺字,"像"字后有脱漏,应为某种冠/弁名称,暂照录。
  2. L568 "黑##"——原文此处有乱码/缺字,疑为形容发色的修饰词。
  3. L92 "¥檩"——原文此处有乱码,非服饰内容,未纳入提取。

备注

  • 本文为鼓词体裁,韵文部分服饰描写更为密集精炼,散文部分多为叙事性提及
  • 服饰描写集中在人物出场、贫富对比、婚嫁场景、丧葬场景四个功能节点
  • 全文服饰体系覆盖了明代社会中官、儒、民、僧、丧、婚、军等主要服饰类别