元诗别裁集 服饰提取日志
基本信息
- 书名:元诗别裁集
- 文件路径:/home/z/my-project/upload/诗集/诗集/元诗别裁集.txt
- 文件大小:2750行 / 175,765字节
- 输出目录:/home/z/my-project/upload/诗集output/元诗别裁集/
第一阶段:文件探查
wc -l -c /home/z/my-project/upload/诗集/诗集/元诗别裁集.txt
# 结果:2750行 175765字节(中等体积,可逐轮grep处理)
第二阶段:5轮grep关键词提取
第1轮:核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领)
rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|佩|玉|带|绶|笏|舄|履|靴|袍|衫|裙|褶|袂|襟|领' 元诗别裁集.txt
- 匹配行数:210行
- 有效服饰行:约55行(大量"衣"在"依""衣冠=士大夫"等非服饰语境中,需人工甄别)
第2轮:材质词(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧)
rg -n '锦|绮|绢|帛|丝|缎|绫|罗|纱|缟|绸|葛|麻|褐|布|绵|茧' 元诗别裁集.txt
- 匹配行数:101行
- 有效服饰行:约28行("锦"多用于景物如"锦江""锦城",需筛选)
第3轮:色彩纹饰词(紫绯朱赭青绿白玄黄丹素绣纹章黼黻华)
rg -n '紫|绯|朱|赭|青|绿|白|玄|黄|丹|素|绣|纹|章|黼|黻|华' 元诗别裁集.txt
- 匹配行数:440行(色彩词命中最多,但绝大多数为景物描写非服饰)
- 有效服饰行:约12行(如"紫袍""绯桃""素练"等需严格筛选)
第4轮:制度词(服赐品色舆服章服冠服朝服祭服丧服常服加冠衮)
rg -n '服|赐|品色|舆服|章服|冠服|朝服|祭服|丧服|常服|加冠|衮' 元诗别裁集.txt
- 匹配行数:15行
- 有效服饰行:约8行("服"字多用于"降服""佩服"等非服饰义项,"赐"多指赐金赐酒)
第5轮:配饰词(簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼)
rg -n '簪|钗|钿|珰|珥|环|镯|鱼袋|幞头|云肩|霞帔|蔽膝|芾|韠|佩鱼' 元诗别裁集.txt
- 匹配行数:24行
- 有效服饰行:约10行("环"多用于"回环""环绕",需甄别)
第三阶段:sed上下文提取
对有效行号执行sed提取原文:
sed -n '71p;107p;109p;111p;113p;115p;198p;203p;270p;334p;343p;369p;394p;418p;438p;488p;490p;494p;537p;542p;547p;549p;554p;558p;560p;562p;595p;600p;608p;613p;618p;623p;637p;647p;713p;757p;787p;818p;859p;970p;975p;1068p;1103p;1110p;1133p;1169p;1171p;1173p;1197p;1214p;1219p;1241p;1298p;1302p;1306p;1308p;1310p;1319p;1349p;1379p;1392p;1397p;1443p;1448p;1452p;1456p;1458p;1460p;1462p;1495p;1511p;1520p;1535p;1537p;1539p;1557p;1572p;1593p;1611p;1613p;1625p;1630p;1635p;1664p;1672p;1692p;1705p;1710p;1743p;1785p;1805p;1810p;1839p;1877p;1881p;1901p;1908p;1913p;1918p;1932p;2068p;2193p;2258p;2362p;2401p;2463p;2493p' 元诗别裁集.txt
共提取约100行原文,供人工二次筛选。
第四阶段:有效片段筛选标准与结果
筛选标准(严格执行)
| 保留 | 排除 |
|---|
| "衣"用于实际穿着(寒衣、布袍、新衣) | "衣"在比喻/固定词组中(苔衣、衣冠=士大夫阶层代称) |
| "裳"用于下裳/裙裾 | "裳"在"衣裳"泛指中无服饰细节者 |
| "冠"用于实际冠帽(儒冠、黄冠) | "冠"在"冠盖""冠绝"中(非服饰义) |
| "佩"用于实际佩戴物(珩佩、玉佩) | "佩"在"佩服""钦佩"中 |
| "带"用于腰带/革带(锦带、组带) | "带"在"地带""连带"中 |
| "罗/锦/绮"用于衣料 | "罗"在"森罗""罗列"中,"锦"在"锦江""锦城"地名中 |
| "环"用于环形饰品 | "环"在"回环""环绕"中 |
最终有效片段统计
| 类别 | 有效片段数 | 代表行号 |
|---|
| 农家织作与日常服饰 | 15 | L71,107,109,111,113,115,198,494,787,859,1068,373,600,2193,2258 |
| 官服制度与朝仪 | 12 | L67,1241,1539,1613,1918,1173,970,1537,1901,514,549,1908 |
| 女性服饰 | 10 | L554,623,1349,1392,1462,1443,1932,494,1197,1710 |
| 军事服饰 | 6 | L418,490,488,558,1456,1458 |
| 道教/仙家服饰 | 4 | L618,1877,1319,1032 |
| 外国/少数民族服饰 | 2 | L547,549 |
| 配饰 | 8 | L554,438,1932,1705,1839,1460,452,1169 |
合计有效服饰片段:约60处
第五阶段:对抗式学术审查
审查1:误收风险排查
| 疑似片段 | 审查结论 | 处理 |
|---|
| L265"神襟轶寥廓" | "襟"=胸襟,非衣襟 | 排除 |
| L369"苔衣湿" | "苔衣"=苔藓覆盖,非衣物 | 排除 |
| L48"挂冠遂忘返" | "挂冠"=辞官典故,但涉及冠帽脱卸动作 | 保留(有服饰文化价值) |
| L67"衣冠集群彦" | "衣冠"为士大夫代称,非实指穿着 | 保留(服制身份象征意义) |
| L713"雨砌长苔衣" | "苔衣"非服饰 | 排除 |
| L975"岸帻独登临" | "岸帻"=推起头巾,涉帻制 | 保留 |
| L1625"驰道尘香逐玉珂" | "玉珂"为马饰非人饰 | 排除 |
| L1810"细雨霏霏不湿衣" | "衣"为泛指 | 保留(虽泛指但属穿着语境) |
审查2:遗漏风险排查
| 关键词 | 是否可能遗漏 | 补充措施 |
|---|
| "褐" | L373"披褐入西园"已收录 | 无遗漏 |
| "纩" | L198"御寒类挟纩"已收录 | 无遗漏 |
| "苎" | L554"自裁白苎制舞袍"已收录 | 无遗漏 |
| "罽" | L1302"赋成特赐麒麟罽"已收录 | 无遗漏 |
| "裙" | L1110"蒨裙"、L494"布裙"、L1932"裙薄绡长皱"均已收录 | 无遗漏 |
审查3:时代归属核实
- L547-549涉及元至正二年(1342)拂郎国献马事件,确为元代史实,服饰描述可靠。
- L71-115赵孟頫《十二月农家词》为元初作品,织作服饰描写可信。
- L1932宫体长诗作者需考,但所写服饰物项(深衣、蔽膝、宝钗等)合乎元代至明初特征。
审查4:过度解读风险
- L558"金龙五爪蟠彩袍":五爪龙为帝制专属,此处写骑手彩袍装饰,可能为文学夸张而非实写服制。已在总结中注明"可结合出土实物研究"。
- L1462"绣靴蹋踘句骊样,罗帕垂弯女直妆":句骊=高丽,女直=女真,但诗中可能为文人想象异域风情,未必亲见。
第六阶段:命令执行日志
| 序号 | 命令 | 用时 | 结果 |
|---|
| 1 | wc -l -c 元诗别裁集.txt | <1s | 2750行/175765B |
| 2 | rg -n 核心词 元诗别裁集.txt | <1s | 210行匹配 |
| 3 | rg -n 材质词 元诗别裁集.txt | <1s | 101行匹配 |
| 4 | rg -n 色彩纹饰词 元诗别裁集.txt | <1s | 440行匹配 |
| 5 | rg -n 制度词 元诗别裁集.txt | <1s | 15行匹配 |
| 6 | rg -n 配饰词 元诗别裁集.txt | <1s | 24行匹配 |
| 7 | sed -n 行号p 元诗别裁集.txt(分批) | <1s | 提取约100行原文 |
| 8 | 人工筛选与分类 | - | 60处有效片段 |
输出文件清单
| 文件名 | 大小 | 说明 |
|---|
| 元诗别裁集_总结.md | ~18KB | 服饰内容分类总结 |
| 元诗别裁集_日志.md | ~8KB | 提取过程与审查记录 |
| 元诗别裁集_原文提取.md | ~16KB | 有效片段原文(附行号) |