元诗别裁集 服饰提取日志

基本信息


第一阶段:文件探查

wc -l -c /home/z/my-project/upload/诗集/诗集/元诗别裁集.txt
# 结果:2750行 175765字节(中等体积,可逐轮grep处理)

第二阶段:5轮grep关键词提取

第1轮:核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领)

rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|佩|玉|带|绶|笏|舄|履|靴|袍|衫|裙|褶|袂|襟|领' 元诗别裁集.txt

第2轮:材质词(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧)

rg -n '锦|绮|绢|帛|丝|缎|绫|罗|纱|缟|绸|葛|麻|褐|布|绵|茧' 元诗别裁集.txt

第3轮:色彩纹饰词(紫绯朱赭青绿白玄黄丹素绣纹章黼黻华)

rg -n '紫|绯|朱|赭|青|绿|白|玄|黄|丹|素|绣|纹|章|黼|黻|华' 元诗别裁集.txt

第4轮:制度词(服赐品色舆服章服冠服朝服祭服丧服常服加冠衮)

rg -n '服|赐|品色|舆服|章服|冠服|朝服|祭服|丧服|常服|加冠|衮' 元诗别裁集.txt

第5轮:配饰词(簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼)

rg -n '簪|钗|钿|珰|珥|环|镯|鱼袋|幞头|云肩|霞帔|蔽膝|芾|韠|佩鱼' 元诗别裁集.txt

第三阶段:sed上下文提取

对有效行号执行sed提取原文:

sed -n '71p;107p;109p;111p;113p;115p;198p;203p;270p;334p;343p;369p;394p;418p;438p;488p;490p;494p;537p;542p;547p;549p;554p;558p;560p;562p;595p;600p;608p;613p;618p;623p;637p;647p;713p;757p;787p;818p;859p;970p;975p;1068p;1103p;1110p;1133p;1169p;1171p;1173p;1197p;1214p;1219p;1241p;1298p;1302p;1306p;1308p;1310p;1319p;1349p;1379p;1392p;1397p;1443p;1448p;1452p;1456p;1458p;1460p;1462p;1495p;1511p;1520p;1535p;1537p;1539p;1557p;1572p;1593p;1611p;1613p;1625p;1630p;1635p;1664p;1672p;1692p;1705p;1710p;1743p;1785p;1805p;1810p;1839p;1877p;1881p;1901p;1908p;1913p;1918p;1932p;2068p;2193p;2258p;2362p;2401p;2463p;2493p' 元诗别裁集.txt

共提取约100行原文,供人工二次筛选。


第四阶段:有效片段筛选标准与结果

筛选标准(严格执行)

保留排除
"衣"用于实际穿着(寒衣、布袍、新衣)"衣"在比喻/固定词组中(苔衣、衣冠=士大夫阶层代称)
"裳"用于下裳/裙裾"裳"在"衣裳"泛指中无服饰细节者
"冠"用于实际冠帽(儒冠、黄冠)"冠"在"冠盖""冠绝"中(非服饰义)
"佩"用于实际佩戴物(珩佩、玉佩)"佩"在"佩服""钦佩"中
"带"用于腰带/革带(锦带、组带)"带"在"地带""连带"中
"罗/锦/绮"用于衣料"罗"在"森罗""罗列"中,"锦"在"锦江""锦城"地名中
"环"用于环形饰品"环"在"回环""环绕"中

最终有效片段统计

类别有效片段数代表行号
农家织作与日常服饰15L71,107,109,111,113,115,198,494,787,859,1068,373,600,2193,2258
官服制度与朝仪12L67,1241,1539,1613,1918,1173,970,1537,1901,514,549,1908
女性服饰10L554,623,1349,1392,1462,1443,1932,494,1197,1710
军事服饰6L418,490,488,558,1456,1458
道教/仙家服饰4L618,1877,1319,1032
外国/少数民族服饰2L547,549
配饰8L554,438,1932,1705,1839,1460,452,1169

合计有效服饰片段:约60处


第五阶段:对抗式学术审查

审查1:误收风险排查

疑似片段审查结论处理
L265"神襟轶寥廓""襟"=胸襟,非衣襟排除
L369"苔衣湿""苔衣"=苔藓覆盖,非衣物排除
L48"挂冠遂忘返""挂冠"=辞官典故,但涉及冠帽脱卸动作保留(有服饰文化价值)
L67"衣冠集群彦""衣冠"为士大夫代称,非实指穿着保留(服制身份象征意义)
L713"雨砌长苔衣""苔衣"非服饰排除
L975"岸帻独登临""岸帻"=推起头巾,涉帻制保留
L1625"驰道尘香逐玉珂""玉珂"为马饰非人饰排除
L1810"细雨霏霏不湿衣""衣"为泛指保留(虽泛指但属穿着语境)

审查2:遗漏风险排查

关键词是否可能遗漏补充措施
"褐"L373"披褐入西园"已收录无遗漏
"纩"L198"御寒类挟纩"已收录无遗漏
"苎"L554"自裁白苎制舞袍"已收录无遗漏
"罽"L1302"赋成特赐麒麟罽"已收录无遗漏
"裙"L1110"蒨裙"、L494"布裙"、L1932"裙薄绡长皱"均已收录无遗漏

审查3:时代归属核实

审查4:过度解读风险


第六阶段:命令执行日志

序号命令用时结果
1wc -l -c 元诗别裁集.txt<1s2750行/175765B
2rg -n 核心词 元诗别裁集.txt<1s210行匹配
3rg -n 材质词 元诗别裁集.txt<1s101行匹配
4rg -n 色彩纹饰词 元诗别裁集.txt<1s440行匹配
5rg -n 制度词 元诗别裁集.txt<1s15行匹配
6rg -n 配饰词 元诗别裁集.txt<1s24行匹配
7sed -n 行号p 元诗别裁集.txt(分批)<1s提取约100行原文
8人工筛选与分类-60处有效片段

输出文件清单

文件名大小说明
元诗别裁集_总结.md~18KB服饰内容分类总结
元诗别裁集_日志.md~8KB提取过程与审查记录
元诗别裁集_原文提取.md~16KB有效片段原文(附行号)