《元诗体要》服饰内容提取日志

基本信息

处理流程

第一步:文件大小检查

wc -l /home/z/my-project/upload/诗集/诗集/元诗体要.txt
# 结果:3166行,属中等体量,可逐轮grep处理

第二步:五轮关键词grep

第1轮:核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领)

grep -n '衣\|裳\|裘\|冠\|冕\|弁\|帻\|巾\|帽\|佩\|玉\|带\|绶\|笏\|舄\|履\|靴\|袍\|衫\|裙\|褶\|袂\|襟\|领' 元诗体要.txt
# 命中行数:约320行(含大量"衣"字泛用)

第2轮:材质(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧)

grep -n '锦\|绮\|绢\|帛\|丝\|缎\|绫\|罗\|纱\|缟\|绸\|葛\|麻\|褐\|布\|绵\|茧' 元诗体要.txt
# 命中行数:约280行

第3轮:色彩纹饰(紫绯朱赭青绿白玄黄丹素绣纹章黼黻华)

grep -n '紫\|绯\|朱\|赭\|青\|绿\|白\|玄\|黄\|丹\|素\|绣\|纹\|章\|黼\|黻\|华' 元诗体要.txt
# 命中行数:约530行(颜色词泛用率极高)

第4轮:制度(服赐品色舆朝祭丧衮)

grep -n '服\|赐\|品\|色\|舆\|朝\|祭\|丧\|衮' 元诗体要.txt
# 命中行数:编码错误,部分输出截断
# 补充使用针对性grep

第5轮:配饰(簪钗钿珰珥环镯鱼袋幞头肩帔蔽膝芾韠佩鱼)

grep -n '簪\|钗\|钿\|珰\|珥\|环\|镯\|鱼\|袋\|幞\|头\|肩\|帔\|蔽\|膝\|芾\|韠' 元诗体要.txt
# 命中行数:约250行("鱼""头"等泛用词干扰大)

第三步:sed提取关键上下文

对五轮grep筛选出的有效行号,使用sed提取上下文:

# 典型提取命令(逐批执行)
sed -n '44,46p' 元诗体要.txt    # 冕旒/羊裘
sed -n '50,56p' 元诗体要.txt    # 玉珥/玄服/彤裳
sed -n '60,68p' 元诗体要.txt    # 锦玉/素衣/簪
sed -n '110,114p' 元诗体要.txt  # 姣服/明珰/垂衣裳
sed -n '126,134p' 元诗体要.txt  # 锦绣段/衣褐/衣葛/绣柱/锦囊
sed -n '142,147p' 元诗体要.txt  # 翠羽裘/休洗红
sed -n '157,158p' 元诗体要.txt  # 鲛女织绖
sed -n '161,163p' 元诗体要.txt  # 缝嫁衣/云锦章/玄黼舜衣裳
sed -n '175,176p' 元诗体要.txt  # 绣朱襮/锦衣
sed -n '181,183p' 元诗体要.txt  # 罗衣/茜罗绶带/钗梁
sed -n '185,186p' 元诗体要.txt  # 短衣破帽
sed -n '189,190p' 元诗体要.txt  # 羽衣仙
sed -n '200,203p' 元诗体要.txt  # 霞绡/霓裳/白玉弁/翡翠冠
sed -n '253,254p' 元诗体要.txt  # 葛巾
sed -n '319,320p' 元诗体要.txt  # 同袍/揽衣
sed -n '369,371p' 元诗体要.txt  # 锦袍/单衣裳/翠袂黄金珰
sed -n '401,402p' 元诗体要.txt  # 俨冠劎/袗衣
sed -n '409,410p' 元诗体要.txt  # 锦裆/燕钗
sed -n '432,433p' 元诗体要.txt  # 千金裘/锦袍
sed -n '485,486p' 元诗体要.txt  # 朱芾/羽扇/补舜衣裳/脱冠
sed -n '501,502p' 元诗体要.txt  # 佩服金鸳鸯/月珰
sed -n '514,515p' 元诗体要.txt  # 锦袍去
sed -n '524,525p' 元诗体要.txt  # 霓裳/锦袍
sed -n '531,532p' 元诗体要.txt  # 冠芙蓉
sed -n '533,534p' 元诗体要.txt  # 霓冠/袨服
sed -n '537,538p' 元诗体要.txt  # 投冠解绶/练裳/捐佩
sed -n '541p' 元诗体要.txt      # 蜀锦
sed -n '554p' 元诗体要.txt      # 褐/文绣
sed -n '565p' 元诗体要.txt      # 衣之狐裘
sed -n '590,591p' 元诗体要.txt  # 霑裳/罥衣/紫云裘
sed -n '606p' 元诗体要.txt      # 敛袂/衰麻
sed -n '615,617p' 元诗体要.txt  # 衣貂/緼枲/衣裳单/纒头锦
sed -n '619p' 元诗体要.txt      # 翠袖斑斓
sed -n '621p' 元诗体要.txt      # 湿罗衣
sed -n '626,629p' 元诗体要.txt  # 花影满春衣/血色鸳罗/翠钿花
sed -n '631,641p' 元诗体要.txt  # 佩环/缕金衣/半臂/罗襦
sed -n '654p' 元诗体要.txt      # 宫锦裁衣锡圣恩
sed -n '665p' 元诗体要.txt      # 紫衣小队
sed -n '715p' 元诗体要.txt      # 紫绮裘
sed -n '791p' 元诗体要.txt      # 羊裘/裘褐
sed -n '813p' 元诗体要.txt      # 觅襦/觅袴/机中布
sed -n '831p' 元诗体要.txt      # 花袍
sed -n '853p' 元诗体要.txt      # 青布
sed -n '858p' 元诗体要.txt      # 辇金帛
sed -n '890p' 元诗体要.txt      # 越罗衣/裂帛
sed -n '915p' 元诗体要.txt      # 挂冠
sed -n '921p' 元诗体要.txt      # 衣冠自淳古
sed -n '957p' 元诗体要.txt      # 玉佩纚纚
sed -n '987p' 元诗体要.txt      # 无緼袍/无完裙
sed -n '995p' 元诗体要.txt      # 风裾浪袂/蓝靿靴
sed -n '1005,1007p' 元诗体要.txt # 芙蓉裳/仙裳/佩环/霞冠/罗袜
sed -n '1009p' 元诗体要.txt     # 金缕衣
sed -n '1013p' 元诗体要.txt     # 霞裾白霓裳/凤梭制锦/璚佩
sed -n '1017p' 元诗体要.txt     # 胡风中人裂我衣
sed -n '1023p' 元诗体要.txt     # 锦衾复罗荐
sed -n '1031p' 元诗体要.txt     # 鸳鸯绮/罗袜松
sed -n '1033p' 元诗体要.txt     # 白苎/玉系腰
sed -n '1060p' 元诗体要.txt     # 插丫髻/湿裳衣
sed -n '1126p' 元诗体要.txt     # 宝钗/非时样
sed -n '1146p' 元诗体要.txt     # 罗衣/金泥凤
sed -n '1156p' 元诗体要.txt     # 罗袜/红裀/绛缕
sed -n '1182p' 元诗体要.txt     # 大佩垂朝绅/玉环
sed -n '1201p' 元诗体要.txt     # 轻罗衣/翠裙
sed -n '1242p' 元诗体要.txt     # 轻衫剪越罗
sed -n '1321p' 元诗体要.txt     # 苎罗衣
sed -n '1347p' 元诗体要.txt     # 石榴裙/罗带/玉佩/霓裳
sed -n '1351p' 元诗体要.txt     # 亲送寒衣
sed -n '1358,1360p' 元诗体要.txt # 脱却布袴
sed -n '1372,1374p' 元诗体要.txt # 脱布袴/索襦袴
sed -n '1398p' 元诗体要.txt     # 绣罗袂单
sed -n '1406p' 元诗体要.txt     # 越罗/金缕/绣鸳鸯
sed -n '1419p' 元诗体要.txt     # 罗袂
sed -n '1421,1423p' 元诗体要.txt # 罗裙/罗韈/霓裳
sed -n '1446p' 元诗体要.txt     # 鸾镜
sed -n '1457p' 元诗体要.txt     # 盘龙
sed -n '1463p' 元诗体要.txt     # 金针/扇罗
sed -n '1477p' 元诗体要.txt     # 砑缭绫
sed -n '1487p' 元诗体要.txt     # 湘裙/罗袜
sed -n '1508,1512p' 元诗体要.txt # 绮轮/春衣/罗幕
sed -n '1539,1541p' 元诗体要.txt # 轻霜着裘帽/青绮冠/绿玉杖
sed -n '1544p' 元诗体要.txt     # 蝉翼/凤毛/舞裀/宫人绶/幱袍
sed -n '1593p' 元诗体要.txt     # 无题注(典故)
sed -n '1611p' 元诗体要.txt     # 金缕歌/象床/氊作幕
sed -n '1617p' 元诗体要.txt     # 宫袍
sed -n '1621p' 元诗体要.txt     # 祫罗半臂/织翠裳
sed -n '1665p' 元诗体要.txt     # 裁异锦
sed -n '1735,1737p' 元诗体要.txt # 袜尘香/佩珰/翠钿
sed -n '1759p' 元诗体要.txt     # 破帽
sed -n '1761p' 元诗体要.txt     # 翠蓑/青绫
sed -n '1838p' 元诗体要.txt     # 衣冠尽化鱼
sed -n '1920,1924p' 元诗体要.txt # 剑佩明/黼/旌旗

第四步:筛选与分类

筛选标准

  1. 排除纯借字(如"衣"仅作"衣钵""衣冠"泛指而无服饰实义者酌情取舍)
  2. 排除颜色词泛用(如"白云""青山"无服饰关联者)
  3. 保留典故化用(如"垂衣裳"虽为政治术语,仍属服制概念)
  4. 保留"以俗写仙"式服饰投射

有效片段统计

第五步:对抗式审查

#审查项结论
1L200"霞绡中单云锦缘"是否实写服制否,以人间朝服内衬想象仙界衣冠,属典故投射
2L665"紫衣"是否反映元代赐紫不确定,元诗多用唐宋典,系典故化用
3L485"山龙华虫"是否十二章纹是,出《尚书·益稷》,有效
4L987"无緼袍/无完裙"是否实写兼具典故(《论语》緼袍)与纪实,有效
5L113"垂衣裳"是否服饰内容属服制概念(出《易·系辞》),标注典故,收录
6L1033"白苎细折玉系腰"是否实写舞衣是,白苎舞衣为六朝以来传统,有效
7L1621"祫罗半臂"是否写实"半臂"为唐宋实有服饰,元诗沿用,有效
8L409"锦裆卸尽流苏帏"是否服饰"锦裆"为内衣,"流苏帏"为帷帐,混合描写,部分有效
9L831"花袍"是否异族服饰诗写日本/高丽使节,"花袍"或为异国朝服,有效
10L1761"翠蓑"是否服饰蓑衣为渔夫雨具,属民间服饰类,有效

处理命令汇总

步骤命令说明
1wc -l文件行数统计
2grep -n ×5轮五类关键词检索
3sed -n 'Xp' ×约60批关键行上下文提取
4人工筛选排除泛用、保留有效
5对抗审查10项疑点审定
6分类整理六大类别归档