续词余丛话 · 服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 输入文件 | /home/z/my-project/upload/剧曲/剧曲/续词余丛话.txt |
| 输出目录 | /home/z/my-project/upload/剧曲output/续词余丛话/ |
| 文件总行数 | 89 |
| 处理时间 | 2026-03-05 |
提取过程
第1轮:广域扫描
使用完整服饰关键词词库进行首轮grep:
关键词:衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛
命中行:16, 17, 18, 19, 20, 29, 32, 34, 35, 36, 40, 43, 49, 50, 52, 53, 55, 58, 62, 63, 64, 65, 66, 79, 80, 83, 85, 86, 87, 88
共30行初步命中。
第2轮:精筛过滤
扩展搜索词(加入复合词):
衣妆|衣装|衣衫|道姑|道服|丧衣|罗衫|罗裙|霓裳|霞裳|金莲|绣帏|云鬟|香肩|罗绮|彩袖|环佩|衣裙|青巾|短袍|裘马|乌纱|红袖|草鞋|锦裯|珠帘|羽服|绣褥|装束|鞋履|被袍|巾裹|衣冠|衣锦|衣裳|组佩|花烛|彩币|罗衣|长袖|纱窗|绣帘|暖帐
精筛后命中行:32, 35, 36, 40, 49, 50, 52, 55, 63, 64, 65, 66, 79, 80, 83, 86, 87, 88
共16行有效命中。
第3轮:噪音过滤
以下行虽含关键词但被判定为噪音,予以剔除:
| 行号 | 关键词 | 剔除原因 |
|---|---|---|
| 17 | 绮("绮合") | 为曲牌串合之比喻,非服饰 |
| 18 | 绅("绅士") | "绅士"为社会身份词,非服饰实体 |
| 19 | 皂罗袍 | 曲牌名,非实际服饰 |
| 20 | 无衣无褐 | 诗经引文用于音韵论证,保留(第23条) |
| 29 | 无 | 无实际服饰内容 |
| 34 | 无 | 上下文无服饰 |
| 43 | 无 | 无实际服饰内容 |
| 58 | 无 | 无实际服饰内容 |
| 62 | 无 | 无实际服饰内容 |
| 85 | 绛红袍 | 传奇剧名,非实际服饰 |
第4轮:验证
对最终保留的23条逐一grep验证,确认原文引用准确。
输出文件
| 文件 | 大小限制 | 实际 |
|---|---|---|
| 总结.md | ≤20KB | ~7KB |
| 原文提取.md | ≤20KB | ~10KB |
| 日志.md | ≤20KB | ~3KB |
合计远小于1M限制。