六十种曲寻亲记 服饰提取日志
处理信息
- 输入文件:/home/z/my-project/upload/剧曲/剧曲/六十种曲寻亲记.txt
- 输出目录:/home/z/my-project/upload/剧曲output/六十种曲寻亲记/
- 处理时间:2026-03-05
- 总行数:778行
提取流程
第1轮:wc -l 行数统计
第2轮:全关键词 grep -n 扫描
- 关键词词库:衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛
- 命令:
rg -n '衣|裳|冠|带|...' 六十种曲寻亲记.txt
- 命中行数:约80行
第3轮:逐关键词计数
| 关键词 |
命中次数 |
备注 |
| 带 |
13 |
多为动词"带领""带病",服饰义"袍带""冠带""博带"需甄别 |
| 锦 |
10 |
"锦绣堆""锦衣归""衣锦还乡"等,多数有效 |
| 帐 |
7 |
"罗帐里坐"为曲牌名,"纸帐"为实物 |
| 布 |
8 |
"布裙""布衣""荆布"等,多数有效 |
| 罗 |
6 |
"紫绶罗栏""罗网""罗衫"等,需甄别 |
| 绣 |
4 |
"锦绣堆""绣停针"等 |
| 裙 |
3 |
"布裙""荆钗裙布" |
| 丝 |
3 |
"丝萝"为比喻 |
| 絮 |
3 |
"絮絮叨叨"为动词 |
| 袍 |
3 |
"天香袍染""袍带" |
| 佩 |
2 |
"解佩留貂" |
| 环 |
2 |
多为"环顾"义 |
| 裘 |
1 |
"轻裘" |
| 褐 |
1 |
"短褐" |
| 履 |
2 |
"步履" |
| 袂 |
1 |
|
| 襟 |
1 |
"襟怀" |
| 绶 |
1 |
"紫绶" |
| 帛 |
1 |
|
| 纱 |
1 |
"浣纱"曲名 |
第4轮:噪声过滤
- 已过滤:
- "带领""带病""带剑"——动词,非衣带
- "絮絮叨叨"——拟声词,非棉絮
- "罗网"——比喻,非织物
- "丝萝"——比喻,非织物
- "罗帐里坐"——曲牌名,非实物帷帐
- "绣停针"——曲牌名
- "浣纱"——剧名
- "步履"——行走义
- "襟怀"——胸怀义
第5轮:sed 上下文提取
- 对筛选后行号执行
sed -n 'Np' 提取原文
- 共提取有效服饰描写 35条
输出文件
| 文件 |
大小限制 |
说明 |
| 六十种曲寻亲记_服饰总结.md |
≤20KB |
分类总结 |
| 六十种曲寻亲记_原文提取.md |
≤20KB |
原文引用 |
| 六十种曲寻亲记_日志.md |
≤20KB |
本文件 |
grep 验证记录
$ rg -c '荆钗' 六十种曲寻亲记.txt → 3
$ rg -c '布裙' 六十种曲寻亲记.txt → 1
$ rg -c '鹑衣' 六十种曲寻亲记.txt → 1
$ rg -c '短褐' 六十种曲寻亲记.txt → 1
$ rg -c '锦衣归' 六十种曲寻亲记.txt → 3
$ rg -c '衣锦' 六十种曲寻亲记.txt → 2
$ rg -c '紫绶' 六十种曲寻亲记.txt → 1
$ rg -c '轻裘' 六十种曲寻亲记.txt → 1
$ rg -c '冠带' 六十种曲寻亲记.txt → 1
$ rg -c '袍带' 六十种曲寻亲记.txt → 1
$ rg -c '宽衣博带' 六十种曲寻亲记.txt → 1
$ rg -c '宫花帽' 六十种曲寻亲记.txt → 1
$ rg -c '大帽' 六十种曲寻亲记.txt → 1
$ rg -c '儒衣' 六十种曲寻亲记.txt → 1
$ rg -c '衣装' 六十种曲寻亲记.txt → 2
$ rg -c '荷衣' 六十种曲寻亲记.txt → 1
所有提取条目已通过 grep 验证确认存在于原文。