张协状元 服饰提取日志

处理信息

  • 输入文件:/home/z/my-project/upload/剧曲/剧曲/张协状元.txt
  • 输出目录:/home/z/my-project/upload/剧曲output/张协状元/
  • 文件大小:148,559 bytes
  • 总行数:661行
  • 处理日期:2026-03-05

处理流程

第一步:行数统计

wc -l → 661行

第二步:关键词覆盖扫描

使用服饰关键词词库(52字)逐一grep统计命中行数:

关键词 命中行数 关键词 命中行数 关键词 命中行数
37 9 2
31 5 0
17 6 0
12 6 1
11 6 0
14 6 0
7 5 0
7 4 1
2 2 0
1 1 0
2 1 0
3 1 0
0 1 0
0 0 0
0 0 0

总命中行数(去重):约130行

第三步:精准提取

使用复合关键词模式精准提取,过滤噪音:
- "丝":31行中大量为"丝鞭"(招亲道具,约20处),保留;"丝桐"等乐器义过滤
- "麻":17行中多数为"缉麻"劳作义,保留为纺织服饰关联
- "锦":12行中部分为"锦被堆"等比喻,筛选后保留实质服饰行
- "布":7行中"青布帘"1处为招牌非服饰,注明
- "旗":5行中多数为旗帜义,仅保留与仪仗服饰相关

第四步:分类整理

将提取内容按7类整理:
1. 贫女服饰(核心对比)
2. 科考及第服饰
3. 相府/豪门服饰
4. 虎皮强人装束
5. 员梦先生服饰
6. 文人服饰
7. 纺织与面料

第五步:输出验证

  • 总结.md:<20KB ✓
  • 原文提取.md:<20KB ✓
  • 日志.md:<20KB ✓

噪音过滤说明

过滤类型 示例 说明
"丝鞭"反复 约20处 虽非穿戴服饰,但为招亲核心道具,保留
"缉麻"劳作 约8处 属纺织生产,与服饰面料相关,保留
"布政"地名 本书中无此问题
"锦绣珠玑" 第593行 比喻义,但反映服饰审美,保留
"旗"旗帜 第86行等 强人旗帜,非仪仗服饰,注明

服饰意象特征

本剧服饰最突出的三个意象:

  1. "粗衣布裙" vs "金冠霞帔":贫女的粗朴与幻想的华贵形成核心张力
  2. "绿袍":科举功名的视觉标志,全剧反复出现
  3. "丝鞭":招亲道具,不接丝鞭=拒绝婚姻,推动后半部剧情

名句"罗绮相随罗绮去,布衣逐着布衣流"集中体现了本剧的阶层服饰观。