众妙集 服饰内容提取日志
基本信息
- 书名:众妙集
- 文件路径:/home/z/my-project/upload/诗集/诗集/众妙集.txt
- 文件大小:50170字节,1572行
- 输出目录:/home/z/my-project/upload/诗集output/众妙集/
- 处理时间:2026年3月4日
第一阶段:文件探查
wc -c -l /home/z/my-project/upload/诗集/诗集/众妙集.txt
# 结果:1572行,50170字节(约49KB)
# 判定:中等体积,不整本载入LLM,使用grep+sed逐轮提取
第二阶段:五轮关键词Grep
第1轮:核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领)
grep -n '衣\|裳\|裘\|冠\|冕\|弁\|帻\|巾\|帽\|佩\|玉\|带\|绶\|笏\|舄\|履\|靴\|袍\|衫\|裙\|褶\|袂\|襟\|领' 众妙集.txt
命中行号:29, 33, 53, 59, 201, 217, 223, 231, 283, 311, 357, 421, 427, 429, 477, 531, 579, 595, 597, 635, 679, 725, 755, 839, 877, 881, 893, 951, 979, 1019, 1059, 1075, 1089, 1095, 1101, 1117, 1201, 1301, 1319, 1335, 1343, 1367, 1421, 1429, 1441, 1487, 1489, 1509, 1515, 1545
筛选后有效行:29, 33, 59, 217, 223, 231, 283, 311, 357, 427, 429, 477, 531, 579, 595, 597, 635, 725, 755, 877, 881, 893, 979, 1059, 1075, 1089, 1095, 1101, 1117, 1201, 1319, 1335, 1343, 1367, 1421, 1429, 1441, 1487, 1489, 1515
剔除行:
- L53 "散玉珂":玉珂为马饰,非人服
- L201 "带叶卷残书":带为动词"携带"
- L421 "荒村带返照":带为动词
- L679 "千峰带夕阳":带为动词
- L839 "霏微雨带风":带为动词
- L951 "开云种玉嫌山浅":玉非服饰语境
- L1019 "古树含风常带雨":带为动词
- L1301 "草带泥痕过鹿羣":带为动词
- L1509 "带酒垂鞭":带为动词
- L1545 "河带断氷流":带为动词
第2轮:材质(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧)
grep -n '锦\|绮\|绢\|帛\|丝\|缎\|绫\|罗\|纱\|缟\|绸\|葛\|麻\|褐\|布\|绵\|茧' 众妙集.txt
命中行号:117, 339, 895, 1007, 1075, 1215, 1303, 1357, 1371, 1439, 1445, 1483
筛选后有效行:1075(布衣), 1303(缲丝)
剔除行:
- L117 "桑麻":农事非服饰
- L339 "散帙":书帙非衣
- L895 "绮城":城名
- L1007 "桑麻":农事
- L1215 "锦城":成都别称
- L1357 "锦翼":鸟羽
- L1371 "罗隐":人名
- L1439 "罗道士":人名/道号
- L1445 "葛仙井":地名
- L1483 "罗江舍":地名
第3轮:色彩纹饰(紫绯朱赭青绿白玄黄丹素绣纹章黼黻华)
grep -n '紫\|绯\|朱\|赭\|青\|绿\|白\|玄\|黄\|丹\|素\|绣\|纹\|章\|黼\|黻\|华' 众妙集.txt
命中行号:大量(色彩词在唐诗中极为高频)
筛选后与服饰相关有效行:23, 139, 161, 163, 429, 569, 597, 877, 1335, 1343, 1515, 1527, 1563
剔除说明:大量"白云""青山""黄叶""白首"等为自然景物描写,与服饰无关,予以剔除。重点保留含品色义(紫、绯、朱、青)或直接关联服饰的条目。
第4轮:制度(服赐服赐紫赐绯品色舆服章服冠服朝服祭服丧服常服加冠衮)
grep -n '服\|赐\|品\|舆\|朝\|祭\|丧\|常\|加冠\|衮' 众妙集.txt
命中行号:12, 21, 29, 33, 91, 169, 283, 289, 295, 309, 317, 349, 377, 417, 441, 481, 503, 545, 585, 689, 749, 761, 769, 797, 833, 845, 851, 893, 1019, 1095, 1167, 1199, 1319, 1323, 1327, 1343, 1357, 1431, 1443, 1495, 1521, 1527, 1545
筛选后有效行:29, 33, 169, 893, 1095, 1343
剔除说明:大量"朝"字用于"朝朝""朝廷""朝阳""明朝"等非服饰语境,严格筛选仅保留"朝衣""朝缨"等直接服饰条目。
第5轮:配饰(簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼)
grep -n '簪\|钗\|钿\|珰\|珥\|环\|镯\|鱼\|幞\|云肩\|霞帔\|蔽膝\|芾\|韠\|佩鱼' 众妙集.txt
命中行号:43, 83, 111, 163, 307, 337, 701, 927, 1231, 1335, 1365, 1563
筛选后有效行:163(华簪), 1365(钗——比喻), 1563(华簪)
剔除行:大量"鱼"为动物名,非佩鱼/鱼袋制度语境。
第三阶段:Sed上下文提取
对筛选后的有效行,使用 sed -n 'N-2,N+2p' 提取上下文,共提取约40段,用于分类整理。
命令示例:
sed -n '27,35p' 众妙集.txt # L29 朝衣上下文
sed -n '215,225p' 众妙集.txt # L217 典衣 / L223 巾舄上下文
sed -n '425,431p' 众妙集.txt # L427-429 湿衣/青袍上下文
# ……(共执行约20次sed命令)
第四阶段:分类整理与审查
有效服饰条目统计
| 类别 | 条目数 |
|---|---|
| 朝服/官服 | 10 |
| 品色/章服 | 2 |
| 冠带/礼制 | 5 |
| 道家/仙家服饰 | 3 |
| 释家服饰 | 5 |
| 常服/日常 | 7 |
| 鞋履 | 3 |
| 裘服/军事 | 3 |
| 情感意象(沾衣类) | 5 |
| 合计 | 43 |
对抗式审查问题与处理
| # | 存疑条目 | 问题 | 处理 |
|---|---|---|---|
| 1 | L59 "红莲落故衣" | "故衣"或为莲瓣之喻 | 保留,标注为诗歌意象 |
| 2 | L1335 "红衣尽落渚莲愁" | "红衣"为莲瓣代称 | 降级处理,标注非实指衣物 |
| 3 | L1365 "长松夜落钗千股" | "钗"喻松针 | 剔除,纯比喻修辞 |
| 4 | L569 "绯幡" | 丧幡非衣物 | 保留,"绯"涉品色制度 |
| 5 | L881 "佩吴钩" | 吴钩为兵器 | 保留,"佩"为服饰佩戴行为 |
| 6 | L477 "弓裘" | 或为家学传承之喻 | 保留,"裘"确为皮衣 |
| 7 | L1059 "佩旌" | 旌为旗帜非佩饰 | 保留,"佩"为佩戴行为 |
| 8 | L23 "紫塞" | 长城别称 | 剔除,与服饰无关 |
| 9 | L161 "紫陌" | 京城道路 | 剔除,与服饰无关 |
| 10 | L1303 "缲丝" | 丝织工序非服饰 | 保留,为服饰材质生产环节 |
审查结论
本集服饰内容以意象化、符号化运用为主,凡43条。其中:
- 具象服饰描写约12条(朝衣、青袍、豸冠、袍色绶香、狐裘、朱履、布衣、禅衣、比丘衣、垂项帽、巾舄、僊帔)
- 身份符号化运用约14条(华簪、冠带、印绶、朝缨、青绶、冕旒、拾紫、冠剑等)
- 情感意象化运用约10条(沾衣类5条、拂衣、典衣、客衣单等)
- 其他/边缘约7条
无虚构、无推测性补充,所有条目均有原文行号可溯。