才调集 服饰内容提取日志
基本信息
- 书名:才调集
- 文件:/home/z/my-project/upload/诗集/诗集/才调集.txt
- 行数:3,605行,229,375字节
- 处理时间:2026-03-04
处理流程
Step 1: wc统计
3605行 229375字节
中等规模文件,可全量处理。
Step 2: 五轮grep -c统计
| 轮次 | 关键词类别 | 匹配行数 |
|---|---|---|
| 1 | 核心词 | 392 |
| 2 | 材质 | 202 |
| 3 | 色彩纹饰 | 532 |
| 4 | 制度 | 0 |
| 5 | 配饰 | 64 |
Step 3: 详细grep + sed提取
第1轮:核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领)
匹配392行,数量极大。采用2字词组精筛策略:
- 衣字词组(衣裳/衣冠/衣带/衣襟/锦衣/白衣/青衣/朝衣/征衣/寒衣/蓑衣/罗衣等):约35条有效
- 冠帽类(儒冠/挂冠/冠盖/乌帽/皂貂/扬州帽等):约5条有效
- 裙衫袍类(罗裙/红裙/石榴裙/衫子/锦袍/绣袍/青袍等):约15条有效
- 履靴鞋类(重台屦/文履/锦绣鞵):约3条有效
- 佩绶类(玉佩/环佩/紫绶/绣带/解佩等):约12条有效
第2轮:材质(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧)
匹配202行,筛选后服饰相关约10条:
- 绮罗(L146/1959/2744)、缣(L1517)、藕丝(L1571/584)
- 锦袍(L564)、锦袖(L3471)、锦绣鞵(L642)
- 罗衣/罗裙/罗襦/罗帔等多处
- 麻衣(L964)、布衣(L1888/2623)
第3轮:色彩纹饰
匹配532行,筛选后服饰相关约15条:
- 紫绶(L158)、紫带(L2292)、紫槟榔(L138,帔晕紫色)
- 白衣裳(L1432/1561/1569)、澹黄衣(L925)、黄衣(L3170)
- 青袍(L1959/2721/2989)
- 绣衣裳/绣罗襦/绣袍/绣带等多处
- 金缕(L146/672/574)
第4轮:制度
匹配0行("服赐""赐服""赐紫""品色"等精确词组无匹配)
但通过第1轮扩展检索发现:
- 紫绶悉将军(L158):品服制度
- 金紫少年郎(L243):金鱼袋紫服
- 银鱼袋(L247):品官佩饰
- 空赐罗衣/旧赐罗衣(L658/3016):赏赐制度
- 冕旒(L476):帝王冠服
第5轮:配饰
匹配64行,筛选后服饰相关约15条:
- 金钗/玉钗/凤钗(L138/584/1619/1621)
- 花钿/金钿/翠钿(L138/167/207/647/845/1355/3022/3381)
- 玉步摇(L1360)、翠翘(L510/977/2035)
- 金簪(L939)、翡翠簪(L1941)
- 玉搔头(L476/2300)
- 香囊(L138)
- 蔽膝(L476)
Step 4: 筛选结果
经5轮检索+扩展精筛+人工审查,共筛选出服饰相关条目约80条,分为6大类:
- 官服制度类 6条
- 女性服饰类 约30条
- 男性服饰类 约15条
- 佩饰/腰带类 约12条
- 军旅/征役服饰 约5条
- 宗教服饰 2条
Step 5: 审查备注
- 本集为唐五代诗歌选本,闺情题材占比大,女性服饰描写极为丰富
- 第4轮"制度"零匹配是因为精确词组在诗歌中较少使用,实际品服制度信息蕴含于第1轮结果中
- "为他人作嫁衣裳"(L1661)为千古名句,兼具文学与服饰研究价值
- L476为开元天宝宫廷服饰的集中描写,包含冕旒、蔽膝、貂裘、天袍、玉搔头等多重服饰信息
- "藕丝衫子柳花裙"(L1571)为唐代女性服饰的典型描写