六十种曲龙膏记 · 服饰提取日志

一、提取参数

  • 输入文件:/home/z/my-project/upload/剧曲/剧曲/六十种曲龙膏记.txt
  • 总行数:1317
  • 服饰关键词词库:衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛

二、提取过程

第1轮:宽泛grep

  • 命中行数:163行
  • 发现问题:
  • "罗织"(行74/690)为法律术语,非服饰
  • "锦缠道""锦庭乐"为曲牌名
  • "锦绣"多比喻才华("胸藏锦绣"),需区分
  • "箕裘"为继承家业之意,非服饰

第2轮:组合词grep

  • 使用复合关键词:衣裳|衣冠|冠带|衮衣|玉带|金貂|锦帐|绣阁|绣茵|金帐|绣房|纱窗|珠帘|罗帐|罗衣|罗袖|罗袜|罗裙|纱巾|纨扇|纨袴|宫袍|红袍|冕服|乌纱|紫绶|绿衣|布荆|湘帘|湘簟|锦茵|锦障|锦衣|绣衾|罗帏|纱厨|绣褥|绣窗|绣履|绣袄|绮罗|绮席|绮窗|簪珥|佩环|环佩|裙带|裙裾|罗带|金钗|玉簪|翠袖|霞帔|弓鞋|金莲|白衫|铁褐|直掇|袈裟|征袍|铠甲|甲挂|青布|行缠|絮袄|素缟|孝衣|旗纛|旌旗|征旆|红巾|牙斾|彩旗|羽衣|霞冠|角冠|道妆|戎妆|缟幔|轻纱|细縠|花钿|金钏|玉镜|翠羽|青丝|白练|幞头|绿袍|犀带|偏带|丝萝|绸缪|绛节
  • 命中行数:约75行

第3轮:噪音过滤

  • 过滤项:
  • "罗织"(法律术语)→ 删除
  • "箕裘"(家业继承比喻)→ 删除
  • 曲牌名中的"锦"字 → 删除
  • "锦绣"比喻才华 → 保留但标注

第4轮:分类整理

  • 男子服饰:9条
  • 女子服饰:15条
  • 仙人服饰:4条
  • 室内织物:6条
  • 军事服饰:7条
  • 合计有效服饰条目:约41条

三、输出文件

  1. 总结.md —— ≤20KB ✓
  2. 原文提取.md —— ≤20KB ✓
  3. 日志.md(本文件)—— ≤20KB ✓

四、质量检查

  • 所引原文均来自grep验证 ✓
  • 原文引用不转述 ✓
  • 输出文件总大小 ≤1M ✓
  • 行号标注可追溯 ✓