六十种曲目录 — 服饰提取日志

基本信息

项目 内容
输入文件 /home/z/my-project/upload/剧曲/剧曲/六十种曲目录.txt
输出目录 /home/z/my-project/upload/剧曲output/六十种曲目录/
总行数 140
处理时间 2026-03-05

处理流程

第1步:行数统计

wc -l 六十种曲目录.txt → 140行

第2步:关键词初筛

使用ripgrep对42个服饰关键词逐一匹配,命中13行:
- 第5、6、10、13、18、25、28、45、52、55、84、94、111、118、121行

第3步:上下文提取

对命中行执行 sed -n 'start,endp' 提取上下文,逐行审查语义。

第4步:噪音过滤

行号 关键词 噪音类型 处理
5 绣(绣刻演剧) 出版术语 标注为非服饰义
6 绣(绣刻) 出版术语 标注为非服饰义
10 钗(荆钗记)、簪(玉簪记) 剧名含服饰词 保留剧名
13 簪(玉簪记)、钗(紫钗记) 剧名含服饰词 保留剧名
18 纱(浣纱记) 剧名含服饰词 保留剧名
25 无服饰关键词 误命中 过滤
28 簪(玉簪记) 剧名含服饰词 保留剧名
45 绣、襦(绣襦记) 剧名含服饰词 保留剧名
52 环(玉环记) 剧名含服饰词 保留剧名
55 锦(锦笺记) 剧名含服饰词 保留剧名
84 纱(浣纱记) 重复剧名 标注重复
94 簪(玉簪记) 重复剧名 标注重复
111 绣、襦(绣襦记) 重复剧名 标注重复
118 环(玉环记) 重复剧名 标注重复
121 锦(锦笺记) 重复剧名 标注重复

第5步:输出文件

文件 大小 说明
总结.md <20KB 服饰内容总结分析
原文提取.md <20KB 原文逐条提取
日志.md <20KB 本日志

关键词命中统计

关键词 命中行数 有效行数 说明
4 2 2为"绣刻"出版术语,2为"绣襦记"剧名
2 2 均为剧名
3 3 均为剧名
2 2 均为剧名
2 2 均为剧名
2 2 均为剧名
2 2 均为剧名

结论:本书无服饰实物描写,所有命中均为剧名或出版术语中的服饰用字。剧名中服饰词的分布反映明代传奇命名的文化偏好。