元诗纪事 服饰提取日志

基本信息

处理流程

第一步:文件检查

wc -l /home/z/my-project/upload/诗集/诗集/元诗纪事.txt  # 32355
wc -c /home/z/my-project/upload/诗集/诗集/元诗纪事.txt  # 2188365
mkdir -p /home/z/my-project/upload/诗集output/元诗纪事/

第二步:5轮关键词grep提取

第1轮:核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领)

rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|佩玉|带|绶|笏|舄|履|靴|袍|衫|裙|褶|袂|襟|领' 元诗纪事.txt | head -300

第2轮:材质词(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧)

rg -n '锦|绮|绢|帛|丝|缎|绫|罗|纱|缟|绸|葛|麻|褐|布|绵|茧' 元诗纪事.txt | head -300

第3轮:色彩纹饰词(紫绯朱赭青绿白玄黄丹素绣纹章黼黻华)

rg -n '紫|绯|朱|赭|青|绿|白|玄|黄|丹|素|绣|纹|章|黼|黻|华' 元诗纪事.txt | head -300

第4轮:制度词(服赐服赐紫赐绯品色舆服章服冠服朝服祭服丧服常服加冠衮)

rg -n '服赐|赐紫|赐绯|品色|舆服|章服|冠服|朝服|祭服|丧服|常服|加冠|衮' 元诗纪事.txt | head -300

第5轮:配饰词(簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼)

rg -n '簪|钗|钿|珰|珥|环|镯|鱼袋|幞头|云肩|霞帔|蔽膝|芾|韠|佩鱼' 元诗纪事.txt | head -300

第三步:sed上下文提取

对关键行号执行sed提取前后文,确认服饰内容:

sed -n '1275,1282p' 元诗纪事.txt    # 昭君出塞·宫装换北装
sed -n '3170,3200p' 元诗纪事.txt    # 安南即事·最详民族服饰
sed -n '11140,11150p' 元诗纪事.txt  # 唐宫词·赐紫赐绯
sed -n '15847,15855p' 元诗纪事.txt  # 衮冕法服歌诀
sed -n '3820,3830p' 元诗纪事.txt    # 东湖联句·蔽膝辫发
sed -n '2745,2752p' 元诗纪事.txt    # 御赐文绮绢段
sed -n '2974,2985p' 元诗纪事.txt    # 碧澜妾·春衣罗带
sed -n '10189,10194p' 元诗纪事.txt  # 西湖竹枝词·缕金衫
sed -n '6170,6180p' 元诗纪事.txt    # 织女图·裁春罗
sed -n '4699,4710p' 元诗纪事.txt    # 衮衣
sed -n '5935,5945p' 元诗纪事.txt    # 黼裳

第四步:筛选与排除

排除条目(非服饰内容):

保留条目标准:

  1. 有具体服饰形制描述
  2. 有服饰制度/等级信息
  3. 有材质、色彩、配饰的实质描写
  4. 有民族/地域服饰特征记录

第五步:分类整理

将42处有效片段归入6大类别:

  1. 制度与礼仪服饰(8处)
  2. 民族与地域服饰(4处)
  3. 女性服饰与首饰(10处)
  4. 士人隐逸服饰(10处)
  5. 宫廷与军事服饰(6处)
  6. 民俗与特殊服饰(4处)

第六步:对抗式学术审查

审查问题清单:

问题审查结论
"紫衣"(行324)是否指唐代赐服制度?是。原文"一紫衣顾予起"为万宁宫试贡士时所见宫廷紫衣官员,属服饰制度描写,但已在原文提取中收录
"黄衫吏"(行333)是否为唐代特有?原文为咏宋宫廷诗,黄衫吏为唐宋通用的宫廷小吏服饰,保留
"越罗衣"(行580)是否为实写?是。韩希孟被虏后"嗁痕沾湿越罗衣"为纪实性描写,史料可信
安南服饰(行3173)是否为陈孚亲见?是。陈孚以礼部郎中使安南,驻伪境52日,其自注为亲身观察记录
衮冕歌诀(行15849)是否为元代实录?是。山居新话作者杨瑀为元人,所记郊祀法服为元代制度
"绒帽貂裘"(行1277)是否反映元制?诗题"昭君出塞"为咏史,但"绒帽貂裘"为元人北地装束实况投射
"步摇""玉蝉"等首饰(行11145)是否可靠?为杨维桢咏唐宫词,属文学想象,非唐代实录,已标注
"裁春罗"(行6173)是否反映缠足?"香钩小韈裁春罗"中"香钩"为缠足意象,反映元代上层女性缠足习俗

输出文件

  1. 元诗纪事_总结.md(本文件之配套总结)
  2. 元诗纪事_日志.md(本文件)
  3. 元诗纪事_原文提取.md(带行号的原文片段)