古今禅藻集 服饰提取日志
操作时间:2026-03-05
文件:/home/z/my-project/upload/诗集/诗集/古今禅藻集.txt
总行数:5898
操作记录
步骤1:文件大小检查
wc -l 古今禅藻集.txt
# 结果:5898行
步骤2:5轮grep关键词统计
| 轮次 | 关键词类 | grep命令 | 匹配行数 |
|---|---|---|---|
| 1 | 核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领) | rg -c '[衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领]' | 719 |
| 2 | 材质(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧) | rg -c '[锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧]' | 318 |
| 3 | 色彩纹饰(紫绯朱赭青绿白玄黄丹素绣纹章黼黻华) | rg -c '[紫绯朱赭青绿白玄黄丹素绣纹章黼黻华]' | 1384 |
| 4 | 制度(服赐服赐紫赐绯品色舆服章服冠服朝服祭服丧服常服加冠衮) | rg -c '[服赐服赐紫赐绯品色舆服章服冠服朝服祭服丧服常服加冠衮]' | 878 |
| 5 | 配饰(簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼) | rg -c '[簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼]' | 1370 |
说明:单字grep噪声极大(如"衣"可出现在"衣钵"等非服饰语境,"华"出现极频),第1轮719行需大量过滤。
步骤3:精确词组grep
| 轮次 | 精确词组grep | 匹配行数 | ||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 衣裳\ | 衣冠\ | 冠冕\ | 巾帽\ | 佩玉\ | 玉带\ | 绶\ | 笏\ | 舄\ | 履\ | 靴\ | 袍\ | 衫\ | 裙\ | 褶\ | 袂\ | 裘\ | 弁\ | 帻 | 163 |
| 2 | 锦衣\ | 绮罗\ | 绢帛\ | 绫罗\ | 纱帽\ | 缟素\ | 葛布\ | 褐衣\ | 布衣\ | 绵袍\ | 锦袍\ | 罗衣\ | 罗裳\ | 帛 | 33 | |||||
| 3 | 紫衣\ | 绯衣\ | 青袍\ | 青衫\ | 黄冠\ | 素袍\ | 绣衣\ | 紫袍\ | 绣袂\ | 金冠\ | 紫锦\ | 红罗 | 33 | |||||||
| 4 | 赐服\ | 赐紫\ | 赐绯\ | 章服\ | 冠服\ | 朝服\ | 加冠\ | 衮服\ | 衮衣\ | 赐衣\ | 宫衣\ | 方袍\ | 法服\ | 紫衣\ | 紫泥 | 11 | ||||
| 5 | 簪\ | 钗\ | 钿\ | 珰\ | 珥\ | 鱼袋\ | 幞头\ | 佩鱼\ | 金钗\ | 珠佩\ | 银铛\ | 环佩\ | 簮 | 38 |
合计有效行(去重后):约140行含服饰信息
步骤4:过滤噪声
排除以下非服饰用法:
- 襟怀/开襟/冲襟/清襟等→"襟"为胸怀义
- 履冰/履历/步履→"履"非鞋履义
- 白衣人→典故非实指服饰(L3671)
- 冠玉→容貌比喻(L3569)
步骤5:分类整理
最终提取有效服饰片段约80条,分5大类:
- 核心服饰词:约45条
- 材质词:约20条
- 色彩纹饰词:约15条
- 制度词:约8条
- 配饰词:约25条
(部分条目跨类重复计数)
步骤6:审查
- 虚构服饰:0条
- 误读修正:2条(冠玉→容貌比喻,白衣→典故)
- 存疑已标注:1条(铁衣裳→甲胄确认)
关键发现
- 最有制度史料价值的3条:
- L5665:"朝着重青衫午着绯"——品色服制度
- L2747-2748:"御黄新赐满城看……齐着青衣上戒坛"——僧人服色等级
- L506:"题罢紫衣亲宠锡"——帝王赐僧紫衣制度
- 最有文学价值的3条:
- L579:"缀裙金蛱蝶挿髻玉鸳鸯角婢红罗缜阉奴紫锦裳"
- L259:"剃髪除须违亲背主形容憔悴衣裳蓝缕"
- L223:"褫龙章之盛饰贸穷岩之襹褐"
- 全书服饰密度:约1.4%(80条/5898行),以僧服与隐逸服饰为主