南词叙录 服饰提取日志
基本信息
- 文件:/home/z/my-project/upload/剧曲/剧曲/南词叙录.txt
- 总行数:688行
- 输出目录:/home/z/my-project/upload/剧曲output/南词叙录/
提取过程
第一轮:全词库扫描
- 命令:
rg -n '衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛' "南词叙录.txt"
- 命中行数:约30行
- 初步分类:正文论述行约6行,剧目名称行约24行(两个目录重复)
第二轮:复合词精确扫描
- 命令:
rg -n '布帛|宫锦|绣鞋|罗带|罗帕|罗囊|锦袍|锦香|寒衣|衣锦|还带|进履|单衣|新机锦|昼锦|锦堂|绽锦'
- 命中行数:26行
- 结果与第一轮一致,未发现遗漏
第三轮:扩展词库扫描
- 命令:
rg -n '鞵|鞋|靴|帽|笠|蓑|袈|裟|铠|甲|兜|鍪'
- 新发现:第320行"皮帽"(净角行头)、第52行《王月英月下留鞋》
- 新发现:第248行"鞵"(鞋的古字)
第四轮:旌旗类扫描
- 命令:
rg -n '旌|旆|旗|纛|帷|帐|幄|旛|幡'
- 命中:第248行"旌之"(动词,表彰)、第320行"黄旛绰"(人名)
- 判定:均为噪音,非服饰实物
噪音过滤
| 行号 |
匹配词 |
过滤原因 |
| 248 |
旌 |
"旌之"为动词,表彰义,非旗帜实物 |
| 320 |
旛 |
"黄旛绰"为唐代优人名,非旗帜 |
| 291 |
冠 |
"冠绝"为比喻义,非头冠实物 |
| 全文 |
丝 |
"丝"在本文仅出现于"弦索""丝竹"语境,非服饰 |
| 全文 |
练 |
无匹配 |
最终有效提取
- 正文服饰论述:5处(第248、291、297、305、320行)
- 剧目名称含服饰词:13种(第26-213行、第477-664行各列一次)
- 服饰关键词覆盖:衣、布、帛、锦、鞋(鞵)、帽、袍、罗、带、帕、履、绣
文件大小
- 总结.md:约3KB
- 原文提取.md:约4KB
- 日志.md:约2KB
- 总计远小于1M限制,各文件均≤20KB