茯苓仙传奇 服饰提取日志
处理信息
- 输入文件:/home/z/my-project/upload/剧曲/剧曲/茯苓仙传奇.txt
- 输出目录:/home/z/my-project/upload/剧曲output/茯苓仙传奇/
- 处理时间:2026-03-05
- 总行数:503行
提取流程
第1轮:wc -l 行数统计
第2轮:全关键词 grep -n 扫描
- 关键词词库:衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛
- 命令:
rg -n '衣|裳|冠|带|袍|裘|...' 茯苓仙传奇.txt
- 命中行数:75行
第3轮:逐关键词计数
| 关键词 |
命中次数 |
备注 |
| 麻 |
24 |
绝大多数为"麻姑""麻二"人名,非服饰义,已过滤 |
| 练 |
6 |
多为"练习""修炼"义,非"白练"织物义,已过滤 |
| 衣 |
含衣裳1+其他约15次 |
有效 |
| 冠 |
5 |
有效 |
| 带 |
5 |
多为动词"带领"义,服饰义需甄别 |
| 锦 |
4 |
有效 |
| 佩 |
5 |
多为"佩服""佩带"义 |
| 环 |
5 |
多为"环佩"连用 |
| 旗 |
5 |
有效 |
| 绣 |
3 |
有效 |
| 布 |
5 |
多为"布衣"连用 |
| 帛 |
1 |
|
| 丝 |
3 |
多为"青丝""丝如弦"非织物义 |
| 帐 |
3 |
"销金帐"为曲牌名 |
| 袍 |
2 |
|
| 巾 |
2 |
"巾服"连用 |
| 履 |
2 |
|
| 襟 |
2 |
|
| 罗 |
2 |
|
| 裘 |
1 |
"旌旗裘马" |
| 裾 |
1 |
|
| 旌 |
2 |
|
| 裙 |
1 |
|
| 冕 |
1 |
|
| 簪 |
2 |
|
| 袂 |
1 |
|
| 幰 |
1 |
|
| 幡 |
1 |
|
| 旆 |
1 |
|
第4轮:噪声过滤
- 已过滤:
- "麻姑""麻二"——人名,非服饰
- "练习""修炼"——动词,非织物
- "带领""带剑"——动词,非衣带
- "丝如弦"——比喻,非织物
- "销金帐"——曲牌名,非实物帷帐
- "佩服"——动词,非佩饰
第5轮:sed 上下文提取
- 对筛选后行号执行
sed -n 'Np' 提取原文
- 共提取有效服饰描写 22条
输出文件
| 文件 |
大小限制 |
说明 |
| 茯苓仙传奇_服饰总结.md |
≤20KB |
分类总结 |
| 茯苓仙传奇_原文提取.md |
≤20KB |
原文引用 |
| 茯苓仙传奇_日志.md |
≤20KB |
本文件 |
grep 验证记录
$ rg -c '衣裳' 茯苓仙传奇.txt → 1
$ rg -c '布衣' 茯苓仙传奇.txt → 1
$ rg -c '锦绣' 茯苓仙传奇.txt → 2
$ rg -c '五铢衣' 茯苓仙传奇.txt → 1
$ rg -c '平天冠' 茯苓仙传奇.txt → 1
$ rg -c '彩衣' 茯苓仙传奇.txt → 1
$ rg -c '绣服' 茯苓仙传奇.txt → 1
$ rg -c '敝衣' 茯苓仙传奇.txt → 1
$ rg -c '鲜衣' 茯苓仙传奇.txt → 1
$ rg -c '巾服' 茯苓仙传奇.txt → 2
$ rg -c '冠服' 茯苓仙传奇.txt → 2
$ rg -c '冠袍' 茯苓仙传奇.txt → 1
$ rg -c '短衣' 茯苓仙传奇.txt → 1
$ rg -c '旌旗' 茯苓仙传奇.txt → 2
$ rg -c '露冕星冠' 茯苓仙传奇.txt → 1
所有提取条目已通过 grep 验证确认存在于原文。