《晩清文学丛钞小说戏曲研究卷》服饰内容提取日志

基本信息

项目 内容
书名 晩清文学丛钞小说戏曲研究卷
输入文件 /home/z/my-project/upload/剧曲/剧曲/晩清文学丛钞小说戏曲研究卷.txt
输出目录 /home/z/my-project/upload/剧曲output/晩清文学丛钞小说戏曲研究卷/
文件大小 1,183,300 字节
总行数 6,315 行

处理流程

第一步:总行数统计

wc -l 晩清文学丛钞小说戏曲研究卷.txt
→ 6315 行

第二步:关键词grep统计

使用45个服饰关键词逐一grep,结果如下:

关键词 命中行数 关键词 命中行数 关键词 命中行数
90 19 69
9 5 1
16 1 9
4 13 12
13 5 7
25 48 26
12 1 4
40 16 14
9 52 3
0 0 5
4 0 0
0 0 12
3 30 10
2

合计去重后命中行数:534行

第三步:噪音过滤

采用评分机制过滤噪音:

  1. 强服饰组合词加分:衣裳、衣冠、冠带、凤袄、珠冠、簪缨、罗衾、锦帐、绣帐、布衣、罗裙等40余组合词,出现即加3分
  2. 服饰语境词加分:穿、戴、披、服、饰、制、装、织、裁、缝、绣、染、官、朝、礼、优、伶、戏、剧、扮、演、妆等22个语境词,各加1分
  3. 非服饰语境词减分:资本、主义、革命、政治、经济、出版、发行、编辑等14个噪音词,各减1分
  4. 单关键词低相关度过滤:仅含"环""布""丝""练""麻""幅""帐""罗"等中等精度关键词的行,需通过语境验证

过滤后得分≥2的行:218行

第四步:上下文提取

对218条高分行,扩展±3行上下文,提取完整段落。

人工审阅后,确认以下35处核心服饰段落:

编号 行号 类别 内容简述
1 679 衣冠制度 长裾缝腋广幅垂襟端衣法服唐巾唐襦
2 681 服制变革 冠胡冠而服胡服
3 691 士人服饰 衿缨冠带之伦
4 703 地域服饰 衣广东之衣服饰器用
5 705 武士装束 腰扎白布巾横插双剑
6 709 地域服饰 衣冠文物胜于他土
7 607 戏剧服饰 古代之衣冠唯戏剧可见
8 629 衣冠制度 扮古衣冠登场笑谑
9 671 戏剧服饰 优孟衣冠
10 804 冠服制度 戴冕披衮之声容
11 800 戏剧服饰 优孟之衣冠
12 814 织物寝具 罗衾不耐五更寒
13 903 命妇冠服 戴珠冠披凤袄头戴簪缨
14 1281 衣冠制度 忘上国之衣冠奉豚尾为国粹
15 1756 衣冠制度 存名失实之衣冠礼乐
16 1871 女装变革 去裙而袴且鞾而见腓
17 2155 戏剧服饰 效爨人结束粉墨登场
18 2256 女装制度 叙次妇女装束形体无一语涉及裙下
19 2382 戏剧服饰 短短春衫双卷袖绣帘钩锦帐
20 2392 丧服制度 缟素衣裳翠裙鸳绣红袖鸾绡
21 2659 足饰 诸美人皆不缠足
22 2673 优伶妆饰 品花宝鉴描缋梨园人物
23 2675 优伶妆饰 优伶善修容饰貌眉听目语
24 3133 戏剧服饰 袍笏登场粉墨杂演
25 3135 戏剧服饰 衣冠面目排场节拍
26 3195 服饰文献 徒好书中所纪衣饰饮馔
27 3527 服制变革 辨朝服曹交改洋装
28 4536 女子佩饰 姑苏女子如琼英钗梳吴绵五色云
29 4540 宫廷服饰 画栋珠帘金床玉几宫扇
30 4540续 命妇服饰 巧换西装满簪花全匹鲛绡
31 4546 命妇服饰 雪满貂冠一品衣
32 5658 衣冠制度 优孟衣冠亲说法
33 5898 衣冠制度 猛回头换了汉衣冠
34 6035 佩饰织物 燕怯环娇鸾绡锦绣
35 3197 服饰文献 为他人作嫁衣裳

第五步:输出文件

文件名 大小 说明
晩清文学丛钞小说戏曲研究卷_总结.md ≤20KB 六类服饰内容分类概述
晩清文学丛钞小说戏曲研究卷_原文提取.md ≤20KB 35处核心段落原文,附行号
晩清文学丛钞小说戏曲研究卷_日志.md ≤20KB 本日志

关键发现

  1. 本书非服饰专书,服饰内容散见于戏曲评论与民族主义论述中,需大量过滤噪音。

  2. 衣冠为全书最突出之服饰主题,占核心段落约40%,与晚清民族主义思潮紧密关联。

  3. 戏剧服饰为第二大主题,"古代之衣冠唯戏剧可见"一语概括了戏曲保存衣冠制度之文化功能。

  4. 高噪音关键词:罗(121条,多为书名/人名/虚词)、布(59条,多为"分布""宣布"等非织物用法)、丝(52条,多为"丝毫"等虚词)、环(48条,多为"环球""环境"等非佩饰用法),需严格过滤。

  5. 零命中关键词:缎、缯、绫、绂、黼、鹖、帻、旆,本书无相关内容。

处理时间

2026年3月4日