六十种曲玉簪记——服饰提取日志

基本信息

  • 输入文件:/home/z/my-project/upload/剧曲/剧曲/六十种曲玉簪记.txt
  • 总行数:709
  • 提取时间:2025年

提取过程

第一轮:关键词全扫

  • 使用服饰关键词词库:衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛
  • 命令:rg -n '衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛' 六十种曲玉簪记.txt
  • 初筛命中行数:约116行

第二轮:精细过滤

  • 排除非服饰语境:丝(仅保留"红丝"等服饰/婚俗语境)、布(排除"布施")、带(排除"带领/地带"等动词用法)、幅(未出现独立服饰用法)、环(保留"环佩"类)、旗/旌/旆/纛(保留军旗类)、帷/帐/幄(保留帷帐类)
  • 逐一核查原文上下文,确认服饰语义
  • 最终保留38条有效服饰原文

第三轮:分类整理

  • 按六大类归纳:冠冕朝服、女子服饰、衣料布帛、征衣行旅、旌旗帷帐、玉簪聘物
  • 每条标注行号、曲牌/说白类型、关键词

噪音过滤记录

关键词 过滤原因 示例
动词/量词用法多 "一丝儿赏赐"→非服饰
"布施"频繁出现 "多承布施"→非服饰
动词用法多 "带谁去伏侍"→非服饰
未出现独立服饰用法
多为"绣刻"等非服饰搭配 "绣刻演剧"→非服饰
部分"锦云/锦字"为隐喻 保留"锦衣""锦帐"等实物用法
未出现服饰语境
绶/绂 未出现
黼/黻 未出现
鹖/帻 未出现

输出文件

  • 总结.md:分类概览与叙事功能分析
  • 原文提取.md:38条服饰原文(含行号、曲牌、关键词标注)
  • 日志.md:本文件

文件大小检查

  • 总结.md:约3KB ✓
  • 原文提取.md:约8KB ✓
  • 日志.md:约2KB ✓
  • 均远小于20KB限制