众妙集 服饰内容提取日志

基本信息


第一阶段:文件探查

wc -c -l /home/z/my-project/upload/诗集/诗集/众妙集.txt
# 结果:1572行,50170字节(约49KB)
# 判定:中等体积,不整本载入LLM,使用grep+sed逐轮提取

第二阶段:五轮关键词Grep

第1轮:核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领)

grep -n '衣\|裳\|裘\|冠\|冕\|弁\|帻\|巾\|帽\|佩\|玉\|带\|绶\|笏\|舄\|履\|靴\|袍\|衫\|裙\|褶\|袂\|襟\|领' 众妙集.txt

命中行号:29, 33, 53, 59, 201, 217, 223, 231, 283, 311, 357, 421, 427, 429, 477, 531, 579, 595, 597, 635, 679, 725, 755, 839, 877, 881, 893, 951, 979, 1019, 1059, 1075, 1089, 1095, 1101, 1117, 1201, 1301, 1319, 1335, 1343, 1367, 1421, 1429, 1441, 1487, 1489, 1509, 1515, 1545

筛选后有效行:29, 33, 59, 217, 223, 231, 283, 311, 357, 427, 429, 477, 531, 579, 595, 597, 635, 725, 755, 877, 881, 893, 979, 1059, 1075, 1089, 1095, 1101, 1117, 1201, 1319, 1335, 1343, 1367, 1421, 1429, 1441, 1487, 1489, 1515

剔除行

第2轮:材质(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧)

grep -n '锦\|绮\|绢\|帛\|丝\|缎\|绫\|罗\|纱\|缟\|绸\|葛\|麻\|褐\|布\|绵\|茧' 众妙集.txt

命中行号:117, 339, 895, 1007, 1075, 1215, 1303, 1357, 1371, 1439, 1445, 1483

筛选后有效行:1075(布衣), 1303(缲丝)

剔除行

第3轮:色彩纹饰(紫绯朱赭青绿白玄黄丹素绣纹章黼黻华)

grep -n '紫\|绯\|朱\|赭\|青\|绿\|白\|玄\|黄\|丹\|素\|绣\|纹\|章\|黼\|黻\|华' 众妙集.txt

命中行号:大量(色彩词在唐诗中极为高频)

筛选后与服饰相关有效行:23, 139, 161, 163, 429, 569, 597, 877, 1335, 1343, 1515, 1527, 1563

剔除说明:大量"白云""青山""黄叶""白首"等为自然景物描写,与服饰无关,予以剔除。重点保留含品色义(紫、绯、朱、青)或直接关联服饰的条目。

第4轮:制度(服赐服赐紫赐绯品色舆服章服冠服朝服祭服丧服常服加冠衮)

grep -n '服\|赐\|品\|舆\|朝\|祭\|丧\|常\|加冠\|衮' 众妙集.txt

命中行号:12, 21, 29, 33, 91, 169, 283, 289, 295, 309, 317, 349, 377, 417, 441, 481, 503, 545, 585, 689, 749, 761, 769, 797, 833, 845, 851, 893, 1019, 1095, 1167, 1199, 1319, 1323, 1327, 1343, 1357, 1431, 1443, 1495, 1521, 1527, 1545

筛选后有效行:29, 33, 169, 893, 1095, 1343

剔除说明:大量"朝"字用于"朝朝""朝廷""朝阳""明朝"等非服饰语境,严格筛选仅保留"朝衣""朝缨"等直接服饰条目。

第5轮:配饰(簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼)

grep -n '簪\|钗\|钿\|珰\|珥\|环\|镯\|鱼\|幞\|云肩\|霞帔\|蔽膝\|芾\|韠\|佩鱼' 众妙集.txt

命中行号:43, 83, 111, 163, 307, 337, 701, 927, 1231, 1335, 1365, 1563

筛选后有效行:163(华簪), 1365(钗——比喻), 1563(华簪)

剔除行:大量"鱼"为动物名,非佩鱼/鱼袋制度语境。


第三阶段:Sed上下文提取

对筛选后的有效行,使用 sed -n 'N-2,N+2p' 提取上下文,共提取约40段,用于分类整理。

命令示例:

sed -n '27,35p' 众妙集.txt   # L29 朝衣上下文
sed -n '215,225p' 众妙集.txt  # L217 典衣 / L223 巾舄上下文
sed -n '425,431p' 众妙集.txt  # L427-429 湿衣/青袍上下文
# ……(共执行约20次sed命令)

第四阶段:分类整理与审查

有效服饰条目统计

类别条目数
朝服/官服10
品色/章服2
冠带/礼制5
道家/仙家服饰3
释家服饰5
常服/日常7
鞋履3
裘服/军事3
情感意象(沾衣类)5
合计43

对抗式审查问题与处理

#存疑条目问题处理
1L59 "红莲落故衣""故衣"或为莲瓣之喻保留,标注为诗歌意象
2L1335 "红衣尽落渚莲愁""红衣"为莲瓣代称降级处理,标注非实指衣物
3L1365 "长松夜落钗千股""钗"喻松针剔除,纯比喻修辞
4L569 "绯幡"丧幡非衣物保留,"绯"涉品色制度
5L881 "佩吴钩"吴钩为兵器保留,"佩"为服饰佩戴行为
6L477 "弓裘"或为家学传承之喻保留,"裘"确为皮衣
7L1059 "佩旌"旌为旗帜非佩饰保留,"佩"为佩戴行为
8L23 "紫塞"长城别称剔除,与服饰无关
9L161 "紫陌"京城道路剔除,与服饰无关
10L1303 "缲丝"丝织工序非服饰保留,为服饰材质生产环节

审查结论

本集服饰内容以意象化、符号化运用为主,凡43条。其中:

无虚构、无推测性补充,所有条目均有原文行号可溯。