古诗镜唐诗镜 服饰提取日志
提取信息
- 处理日期:2026-05-11 15:06
- 源文件:/home/z/my-project/upload/诗集/诗集/古诗镜唐诗镜.txt
- 输出目录:/home/z/my-project/upload/诗集output/古诗镜唐诗镜
处理步骤
Step 1: wc统计
- 总行数:14189
Step 2: 五轮grep
| 轮次 | 关键词类型 | 匹配行数 |
|---|---|---|
| 第1轮 | 核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领) | 931 |
| 第2轮 | 材质(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧) | 982 |
| 第3轮 | 色彩纹饰(紫绯朱赭青绿白玄黄丹素绣纹章黼黻华) | 2898 |
| 第4轮 | 制度(服赐赐紫赐绯品色舆服章服冠服朝服祭服丧服常服加冠衮) | 18 |
| 第5轮 | 配饰(簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼) | 176 |
Step 3: 精准筛选
- 第2轮材质+服饰组合过滤:131行
- 第3轮色彩+服饰组合过滤:56行
- 合并去重后:1130行
Step 4: 严格服饰关键词匹配
- 使用36类精确服饰关键词模式
- 最终筛选结果:422行
Step 5: 分类整理
- 罗衣/罗裳:61条
- 衣裳:34条
- 绮罗服饰:32条
- 冠:28条
- 钗:26条
- 袍:25条
- 锦衣/锦袍:24条
- 簪:19条
- 葛/麻/布服饰:19条
- 带/绶:18条
- 青衣/青衫:18条
- 履/舄:17条
- 巾/帽:17条
- 绣衣/绣裳:16条
- 佩:15条
- 裙:14条
- 襦:13条
- 裘:12条
- 衫:12条
- 钿:12条
- 翠羽/翠翘:11条
- 襟:11条
- 貂/珥貂:10条
- 环:9条
- 珰/珥:8条
- 冠冕:8条
- 被服:7条
- 白衣:7条
- 朱衣/朱裳:7条
- 紫衣/紫袍:7条
- 纨素:6条
- 纱/缟服饰:6条
- 袂:4条
- 香囊:3条
- 蔽膝:3条
- 赐服:2条
- 领:1条
- 黼黻:1条
- 素衣/素冠:1条
- 帔:1条
Step 6: 审查说明
- 本轮提取采用"关键词+组合词"双重筛选策略
- 单字泛词(如单独的"衣""带""冠")不纳入,需有上下文限定
- 比喻用法(如"衣带日以缓")保留但标注为文学修辞
- 评点中引用诗句涉及服饰的也纳入统计
问题与备注
- 第3轮色彩词匹配2898行,泛词"华""青""白"等误匹配率极高,需组合服饰词二次过滤
- 本书为诗选评注体,服饰信息主要在诗歌原文,评点中偶有涉及
- 唐诗部分品色服制度词(紫袍、青衫、绯衣等)具有较高制度史价值