古今禅藻集 服饰提取日志

操作时间:2026-03-05
文件:/home/z/my-project/upload/诗集/诗集/古今禅藻集.txt
总行数:5898

操作记录

步骤1:文件大小检查

wc -l 古今禅藻集.txt
# 结果:5898行

步骤2:5轮grep关键词统计

轮次关键词类grep命令匹配行数
1核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领)rg -c '[衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领]'719
2材质(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧)rg -c '[锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧]'318
3色彩纹饰(紫绯朱赭青绿白玄黄丹素绣纹章黼黻华)rg -c '[紫绯朱赭青绿白玄黄丹素绣纹章黼黻华]'1384
4制度(服赐服赐紫赐绯品色舆服章服冠服朝服祭服丧服常服加冠衮)rg -c '[服赐服赐紫赐绯品色舆服章服冠服朝服祭服丧服常服加冠衮]'878
5配饰(簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼)rg -c '[簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼]'1370

说明:单字grep噪声极大(如"衣"可出现在"衣钵"等非服饰语境,"华"出现极频),第1轮719行需大量过滤。

步骤3:精确词组grep

轮次精确词组grep匹配行数
1衣裳\衣冠\冠冕\巾帽\佩玉\玉带\绶\笏\舄\履\靴\袍\衫\裙\褶\袂\裘\弁\163
2锦衣\绮罗\绢帛\绫罗\纱帽\缟素\葛布\褐衣\布衣\绵袍\锦袍\罗衣\罗裳\33
3紫衣\绯衣\青袍\青衫\黄冠\素袍\绣衣\紫袍\绣袂\金冠\紫锦\红罗33
4赐服\赐紫\赐绯\章服\冠服\朝服\加冠\衮服\衮衣\赐衣\宫衣\方袍\法服\紫衣\紫泥11
5簪\钗\钿\珰\珥\鱼袋\幞头\佩鱼\金钗\珠佩\银铛\环佩\38

合计有效行(去重后):约140行含服饰信息

步骤4:过滤噪声

排除以下非服饰用法:

步骤5:分类整理

最终提取有效服饰片段约80条,分5大类:

(部分条目跨类重复计数)

步骤6:审查


关键发现

  1. 最有制度史料价值的3条
  1. 最有文学价值的3条
  1. 全书服饰密度:约1.4%(80条/5898行),以僧服与隐逸服饰为主