《秘殿珠林》服饰提取日志

基本信息

项目 内容
输入文件 /home/z/my-project/upload/书法/书法/秘殿珠林.txt
文件规模 4523行,428,139字节
输出目录 /home/z/my-project/upload/书法output/秘殿珠林/
执行时间 2026-03-05

提取流程

步骤1:验证输入与创建目录

步骤2:一级词粗筛

搜索命令

rg -n '衣裳|服|冠|冕|弁|帻|巾|帽|袍|裘|带|佩|绶|笏|舄|履|鞋|袜|裙|襦|褐|襕|衫|袴|裈|褙|帔|氅|蓑|铠|甲' 秘殿珠林.txt

结果:初次命中约40行,但大量误命中:

步骤3:一级词精准筛

搜索命令

rg -n '衣裳|衣冠|衣服|冠服|冠冕|弁|帻|袍[^笺]|裘|绶|笏|舄|鞋|袜|裙|襦|帔|氅|蓑|铠甲|甲胄' 秘殿珠林.txt

结果:有效命中3行:

步骤4:二级词(织物/材质)搜索

搜索命令

rg -n '锦[^笺]|绮|绢[本帛]|帛|罗[纹衣]|缎|绸|缯|缣|纱|绫|绡|丝|绵|麻|葛|苎|褐布|布衣|金[泥银]|银|玉[石印]|珠|翠|翡翠|琥珀|珊瑚' 秘殿珠林.txt

结果:大量命中,但绝大部分为:

有效服饰命中

步骤5:三级词(工艺/制度/部位)搜索

搜索命令

rg -n '衮|黼|黻|章服|绣[像花]|织[金]|衽|领袖|袂|襟|裾|冠裳|旗|卤簿|仪仗' 秘殿珠林.txt

有效命中

步骤6:四级词+动词词搜索

搜索命令

rg -n '品色|服色|冠服|舆服|朝服|祭服|丧服|吉服|常服|便服|燕服|赐服|赐紫|赐绯|命妇|婚服|着衣|披衣|束带|脱衣|加冠|袭衣' 秘殿珠林.txt

结果:零命中。《秘殿珠林》不涉及品色服制内容。

动词补充搜索

rg -n '着衣|被褐|脱巾|赐.*缯|衣衾|麻鞋' 秘殿珠林.txt

有效命中

步骤7:针对性深度搜索

补充搜索莫月鼎像卷全文中的裈、轩裳、衣袖、褰衣、衔衣、羽扇等:

rg -n '裈|轩裳|衣袖|褰衣|衔衣|羽扇|锦膊|兵甲' 秘殿珠林.txt

新增命中

步骤8:交叉验证

对所有命中行逐行审读,排除:


最终提取统计

级别 搜索词数 粗命中行数 有效服饰行数 误命中率
一级词 29 ~40 3 92.5%
二级词 26 ~80 3 96.3%
三级词 17 ~50 3 94.0%
四级词 18 0 0 N/A
动词词 15 ~5 5
合计 105 ~175 12 93.1%

有效服饰行号:3, 1120, 1448, 1451, 1583, 1777, 1995, 2686, 2821, 2895, 3083, 3135


关键发现

  1. 《秘殿珠林》为书画目录,服饰信息极度稀少(12/4523=0.27%)
  2. 四级词(品色服制类)完全无命中,反映此书不涉及服制内容
  3. 一至三级词误命中率超90%,主要因年号"甲"、书斋"佩文斋"、书画载体"绢本"等干扰
  4. 莫月鼎像卷(行3135)是全书服饰信息最密集的单一条目,含7个服饰词
  5. 搜山图题跋(行3083)提供了最丰富的道教神像服饰描写

输出文件清单

文件 大小 内容
秘殿珠林_原文提取.md ≤20KB 按类别整理的服饰原文片段
秘殿珠林_总结.md ≤20KB 服饰类别分析与结论
秘殿珠林_日志.md ≤20KB 本文件,提取过程记录