六十种曲目录 — 服饰提取日志
基本信息
| 项目 |
内容 |
| 输入文件 |
/home/z/my-project/upload/剧曲/剧曲/六十种曲目录.txt |
| 输出目录 |
/home/z/my-project/upload/剧曲output/六十种曲目录/ |
| 总行数 |
140 |
| 处理时间 |
2026-03-05 |
处理流程
第1步:行数统计
wc -l 六十种曲目录.txt → 140行
第2步:关键词初筛
使用ripgrep对42个服饰关键词逐一匹配,命中13行:
- 第5、6、10、13、18、25、28、45、52、55、84、94、111、118、121行
第3步:上下文提取
对命中行执行 sed -n 'start,endp' 提取上下文,逐行审查语义。
第4步:噪音过滤
| 行号 |
关键词 |
噪音类型 |
处理 |
| 5 |
绣(绣刻演剧) |
出版术语 |
标注为非服饰义 |
| 6 |
绣(绣刻) |
出版术语 |
标注为非服饰义 |
| 10 |
钗(荆钗记)、簪(玉簪记) |
剧名含服饰词 |
保留剧名 |
| 13 |
簪(玉簪记)、钗(紫钗记) |
剧名含服饰词 |
保留剧名 |
| 18 |
纱(浣纱记) |
剧名含服饰词 |
保留剧名 |
| 25 |
无服饰关键词 |
误命中 |
过滤 |
| 28 |
簪(玉簪记) |
剧名含服饰词 |
保留剧名 |
| 45 |
绣、襦(绣襦记) |
剧名含服饰词 |
保留剧名 |
| 52 |
环(玉环记) |
剧名含服饰词 |
保留剧名 |
| 55 |
锦(锦笺记) |
剧名含服饰词 |
保留剧名 |
| 84 |
纱(浣纱记) |
重复剧名 |
标注重复 |
| 94 |
簪(玉簪记) |
重复剧名 |
标注重复 |
| 111 |
绣、襦(绣襦记) |
重复剧名 |
标注重复 |
| 118 |
环(玉环记) |
重复剧名 |
标注重复 |
| 121 |
锦(锦笺记) |
重复剧名 |
标注重复 |
第5步:输出文件
| 文件 |
大小 |
说明 |
| 总结.md |
<20KB |
服饰内容总结分析 |
| 原文提取.md |
<20KB |
原文逐条提取 |
| 日志.md |
<20KB |
本日志 |
关键词命中统计
| 关键词 |
命中行数 |
有效行数 |
说明 |
| 绣 |
4 |
2 |
2为"绣刻"出版术语,2为"绣襦记"剧名 |
| 钗 |
2 |
2 |
均为剧名 |
| 簪 |
3 |
3 |
均为剧名 |
| 纱 |
2 |
2 |
均为剧名 |
| 襦 |
2 |
2 |
均为剧名 |
| 环 |
2 |
2 |
均为剧名 |
| 锦 |
2 |
2 |
均为剧名 |
结论:本书无服饰实物描写,所有命中均为剧名或出版术语中的服饰用字。剧名中服饰词的分布反映明代传奇命名的文化偏好。