荆釵记 — 服饰提取日志
任务信息
- 输入文件:/home/z/my-project/upload/剧曲/剧曲/荆釵记.txt
- 输出目录:/home/z/my-project/upload/剧曲output/荆釵记/
- 处理时间:2026-03-05
处理步骤
Step 1: 行数统计
wc -l 荆釵记.txt
# 结果: 1027行
Step 2: 关键词频次扫描
逐词统计55个服饰关键词出现次数,有效命中32个关键词,23个关键词(屦、绅、弁、冕、珥、缎、缯、黼、黻、鹖、帻、帷、幄、旆、纛等)零命中。
Step 3: 全文grep
rg -n '衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛' 荆釵记.txt
# 结果: 约170行
Step 4: 复合词精细搜索
rg -n '衣冠|衣锦|儒衣|儒冠|锦衣|锦袍|蟒袍|朝衣|朝服|冠带|簪缨|罗衫|绮罗|金钗|凤头钗|银钗|荆钗|裙布|绣鞋|绣履|绣房|素缟|素服|罗衣|布袍|布衣|绿袍|锦袍|银绶|紫绶|金章|象简|乌靴|纱帽|宫花|莲花帐|绣褥|白罗|朱旻|翠环|麻衣|征裘|衣袂|霞绡' …
筛得约49条有效服饰行。
Step 5: 噪音过滤
排除以下非服饰语义:
- "环"→围环/翠环(空间/首饰,非佩环传统义),按语境筛选
- "锦绣"→锦绣文章/锦绣邦(比喻),排除
- "絮刮"→言语义,排除
- "丝"→丝肠/一丝(非织物),排除
- "绣球"→非服饰,排除
- "荆钗"虽非词库中关键词,但为本剧核心意象,特殊保留
Step 6: 输出文件
| 文件 | 大小 | 内容 |
|---|---|---|
| 01_总结.md | ~5KB | 服饰内容分类总结 |
| 02_原文提取.md | ~8KB | 逐条原文引用 |
| 03_日志.md | ~2KB | 本文件 |
关键词命中明细
| 关键词 | 次数 | 有效服饰 | 关键词 | 次数 | 有效服饰 |
|---|---|---|---|---|---|
| 衣 | 44 | ✓ 约20条 | 锦 | 19 | ✓ 约5条 |
| 绣 | 29 | ✓ 约10条 | 布 | 19 | ✓ 约4条 |
| 带 | 21 | ✓ 约3条 | 丝 | 9 | △ 0条 |
| 罗 | 9 | ✓ 约4条 | 裙 | 9 | ✓ 约4条 |
| 麻 | 13 | ✓ 约2条 | 冠 | 8 | ✓ 约3条 |
| 袍 | 8 | ✓ 约4条 | 裘 | 5 | ✓ 约2条 |
| 纱 | 7 | ✓ 约2条 | 簪 | 5 | ✓ 约3条 |
| 旌 | 5 | ✓ 约1条 | 绮 | 5 | ✓ 约2条 |
| 絮 | 5 | △ 0条 | 环 | 5 | ✓ 约2条 |
| 襟 | 5 | ✓ 约1条 | 履 | 5 | ✓ 约2条 |
| 裾 | 3 | ✓ 约1条 | 帐 | 3 | ✓ 约1条 |
| 旗 | 4 | ✓ 约1条 | 绶 | 3 | ✓ 约2条 |
| 幅 | 2 | △ 0条 | 袂 | 1 | ✓ 1条 |
| 绡 | 1 | ✓ 1条 | 帛 | 1 | △ 0条 |
| 绢 | 1 | ✓ 1条 | 练 | 1 | △ 0条 |
特色发现
荆釵记的服饰描写具有贫富对比结构:
1. 荆钗vs金钗:王家以荆钗为聘,孙家以金钗压银,贫富判然
2. 布袍vs绿袍:王十朋从"布袍""儒冠"到"乌靴纱帽绿袍新"
3. 裙布荆钗vs绣褥金屏:朴素与奢华的对照贯穿全剧
4. 绣鞋遗江:钱玉莲投江时"脱所穿之绣履",绣鞋成为守节关键物证
5. 素缟持丧:"在任穿些素缟罢""尽把罗衣卸",服饰成为贞洁表达
质量检查
- ✓ 所有引用均为原文,未转述
- ✓ grep验证每条提取均可回溯
- ✓ 未加载整本TXT,按行提取
- ✓ 输出文件均≤20KB
- ✓ 总输出≤1MB