六十种曲邯郸记 — 服饰提取日志
任务信息
- 输入文件:/home/z/my-project/upload/剧曲/剧曲/六十种曲邯郸记.txt
- 输出目录:/home/z/my-project/upload/剧曲output/六十种曲邯郸记/
- 处理时间:2026-03-05
处理步骤
Step 1: 行数统计
wc -l 六十种曲邯郸记.txt
# 结果: 794行
Step 2: 关键词频次扫描
逐词统计55个服饰关键词出现次数,有效命中32个关键词,23个关键词(屦、袂、裾、襟、幅、弁、珥、绢、绸、缯、绡、绂、黻、鹖、帻、帷、幄、旆等)零命中。
Step 3: 全文grep
rg -n '衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛' 六十种曲邯郸记.txt
# 结果: 167行
Step 4: 复合词精细搜索
rg -n '衣冠|衣锦|儒衣|儒冠|锦衣|锦袍|蟒袍|朝衣|朝冠|朝服|冠带|冠冕|簪缨|簪笏|罗衫|罗缎|霓裳|绮罗|紫霓裳|金貂|文绣|翠袖|红妆|内家妆|宫花|战袍|戎装|旌旗|帛书|黼帐|帐殿|红罗伞|丫髻|朝绅|侍中貂|短裘|破裘|羊裘|裘敝貂' …
筛得55条有效服饰行。
Step 5: 噪音过滤
排除以下非服饰语义:
- "环"→报恩环(第438行诗句意象,非佩饰)
- "锦绣"→锦绣江山/锦绣全唐(比喻,非织物实指)——仅保留明确服饰语境
- "绸缪"→无此用法
- "絮叨叨"→言语,非絮衣
- "绣鞋"→"红绣鞋"为曲牌名
- "旗牌""旗牌官"→职官名
Step 6: 输出文件
| 文件 | 大小 | 内容 |
|---|---|---|
| 01_总结.md | ~5KB | 服饰内容分类总结 |
| 02_原文提取.md | ~8KB | 逐条原文引用 |
| 03_日志.md | ~2KB | 本文件 |
关键词命中明细
| 关键词 | 次数 | 有效服饰 | 关键词 | 次数 | 有效服饰 |
|---|---|---|---|---|---|
| 衣 | 29 | ✓ 约18条 | 锦 | 38 | ✓ 约5条 |
| 带 | 29 | ✓ 约4条 | 绣 | 15 | ✓ 约3条 |
| 罗 | 15 | ✓ 约4条 | 丝 | 16 | ✓ 约2条 |
| 旗 | 17 | ✓ 约6条 | 纱 | 13 | ✓ 约2条 |
| 袍 | 14 | ✓ 约6条 | 冠 | 15 | ✓ 约5条 |
| 帐 | 12 | ✓ 约3条 | 裘 | 6 | ✓ 约5条 |
| 裙 | 6 | △ 0条 | 麻 | 6 | △ 0条 |
| 帛 | 5 | ✓ 约3条 | 簪 | 5 | ✓ 约3条 |
| 环 | 6 | △ 0条(非佩饰) | 佩 | 4 | ✓ 约1条 |
| 裳 | 2 | ✓ 约1条 | 褐 | 1 | ✓ 1条 |
| 巾 | 3 | ✓ 约2条 | 履 | 1 | △ 0条 |
| 绅 | 1 | ✓ 1条 | 冕 | 1 | ✓ 1条 |
| 绮 | 1 | ✓ 1条 | 缎 | 1 | ✓ 1条 |
| 绫 | 1 | △ 0条 | 黼 | 1 | ✓ 1条 |
| 旌 | 3 | ✓ 约2条 | 纛 | 1 | △ 0条 |
| 絮 | 2 | △ 0条 | 布 | 3 | △ 0条 |
质量检查
- ✓ 所有引用均为原文,未转述
- ✓ grep验证每条提取均可回溯
- ✓ 未加载整本TXT,按行提取
- ✓ 输出文件均≤20KB
- ✓ 总输出≤1MB
特色发现
邯郸记的服饰描写具有梦境循环结构:
1. 起始:短裘敝貂(寒儒)
2. 入梦:衣冠济楚→儒冠→宫花袍袖(科举得中)
3. 显达:战袍戎装→朝服蟒袍→红玉带(出将入相)
4. 转折:金貂文绣→天寒翠袖(贬谪沦落)
5. 极盛:冠带加身→绮罗金钗(再相极盛)
6. 梦醒:解朝衣朝冠→换旧衣巾→破羊裘(回归寒儒)
7. 仙界:丫髻道扮·象简朝绅(八仙服饰,超越世俗)