云谣集杂曲子 — 服饰提取日志

处理信息

  • 输入文件:/home/z/my-project/upload/剧曲/剧曲/云谣集杂曲子.txt
  • 文件行数:541行
  • 处理时间:2026-03-05
  • 输出目录:/home/z/my-project/upload/剧曲output/云谣集杂曲子/

关键词检索记录

第一轮:全词库grep(35行命中)

rg -n '衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛' 云谣集杂曲子.txt

命中行号:5, 12, 23, 53, 63, 75, 82, 101, 112, 114, 124, 148, 155, 166, 168, 173, 182, 188, 228, 230, 250, 255, 267, 276, 281, 290, 300, 326, 331, 352, 377, 382, 406, 448, 518

第二轮:专项grep(丝织品类)

rg -n '罗|绮|纱|绢|帛|锦|绣|绫|纨|绡|绸|缎|缯' 云谣集杂曲子.txt

确认"罗"字高频出现,但需区分"罗书"(罗振玉校勘本)与服饰用"罗"。

第三轮:sed提取上下文

对35行命中逐一提取前后2-3行上下文,判断服饰关联性。

第四轮:噪音过滤(排除16条)

行号 关键词 噪音原因
82 "罗书"=罗振玉校勘本
112 校注引"罗裳里",属校勘推测
114 "罗书校作"=校勘引用
124 "从罗书校改"
148 "再絮"校注,絮=絮叨义
166 "战袍二句"校注标题
168 校注
182 "戴媚"校注
188 "帐:原写作怅"校注
228 "罗书校作"
230 "罗书校作"
250 "从罗书校改"
276 "兹据罗书校补"
290 "锦字以下残损"校注
331 "绮罗装束"校注
377 "炼:原写作练"异体字校注

注:校注中的"罗裳里"(行112)虽为校勘推测,但因涉及服饰内容予以保留。

第五轮:分类整理

将25条有效结果按服饰类别分类:
- 罗类(轻丝织物):14条(含罗衣、罗裳、罗袖、罗幌、罗衫、罗帐、罗冠、绮罗)
- 裙衫:4条
- 冠饰/首饰:2条(簪缨、金钗)
- 帷帐类:1条(鸾帐)
- 战袍/絮衣:2条
- 丝线/刺绣:2条(红丝、绣床、捣练)

验证grep

# 验证"石榴裙"
rg -n '石榴裙' 云谣集杂曲子.txt → 281:肉红衫子石榴裙 ✓
# 验证"罗衣"
rg -n '罗衣' 云谣集杂曲子.txt → 53:罗衣掩袂 ✓; 406:金粟罗衣 ✓
# 验证"绮罗"
rg -n '绮罗' 云谣集杂曲子.txt → 326:浑身挂绮罗 ✓; 448:湿绮罗 ✓
# 验证"战袍"
rg -n '战袍' 云谣集杂曲子.txt → 155:战袍待? ✓; 166:战袍二句 ✓ (校注)

文件大小

  • 总结.md < 2KB
  • 原文提取.md < 8KB
  • 日志.md < 4KB
  • 合计 < 14KB,远低于1M限制 ✓

备注

本书为敦煌曲子词集,服饰词集中于女性形象描写与闺怨题材,"罗"字为最高频服饰词。需特别注意区分校注中的"罗书"(罗振玉校勘本引用)与正文服饰用"罗",否则将产生大量误匹配。