千家诗·服饰提取日志
基本信息
- 书名:千家诗
- 文件路径:/home/z/my-project/upload/诗集/诗集/千家诗.txt
- 文件大小:2176行,50,990字节(小文件)
- 处理时间:2026-03-04
处理流程
第1步:文件检查
wc -l -c 千家诗.txt
# 结果:2176行,50990字节(小文件,可直接处理)
第2步:逐轮grep检索
第1轮:核心词
rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|佩玉|带|绶|笏|舄|履|靴|袍|衫|裙|褶|袂|襟|领' 千家诗.txt | wc -l
# 结果:37行匹配
实际有效服饰条目仅约18条,大量为"沾巾""带雨""引领"等非服饰用法。
第2轮:材质
rg -n '锦|绮|绢|帛|丝|缎|绫|罗|纱|缟|绸|葛|麻|褐|布|绵|茧' 千家诗.txt | wc -l
# 结果:20行匹配
大量为"花似锦""藕丝""窗纱""绩麻""鬓丝"等非服饰用法。有效仅:布衣(L116)、纱帽(L1392)、轻罗(L1309)、麻苎(L2142)、锦里(L2035)、红锦(L2157)。
第3轮:色彩纹饰
rg -n '紫|绯|朱|赭|青|绿|白|玄|黄|丹|素|绣|纹|章|黼|黻|华' 千家诗.txt | wc -l
# 结果:142行匹配
绝大多数为自然景物颜色,与服饰无关。有效仅:紫绶(L2129)、绛帻(L1572)、翠云裘(L1573)。
第4轮:制度
rg -n '服[饰妆办]|赐服|赐紫|赐绯|品色|舆服|章服|冠服|朝服|祭服|丧服|常服|加冠|衮[服衣冕]' 千家诗.txt | wc -l
# 结果:1行匹配——"衮衣明日月"(L795)
第5轮:配饰
rg -n '簪|钗|钿|珰|珥|环|镯|鱼袋|幞头|云肩|霞帔|蔽膝|芾|韠|佩鱼' 千家诗.txt | wc -l
# 结果:1行匹配——"敲断玉钗红烛冷"(L824)
第3步:高价值组合检索
rg -n '绨袍|布衣|衮衣|衣裳|翠云裘|冕旒|乌角巾|纱帽|蓑衣|红裙|紫绶|战袍|绛帻|裘马|寒衣|血色裙|红衣|南冠|吹帽|正冠' 千家诗.txt
# 结果:19行匹配——覆盖了全书绝大部分有效服饰条目
第4步:关键上下文提取
sed -n '1570,1577p' 千家诗.txt # 王维早朝诗——最完整的朝服描写
sed -n '114,117p' 千家诗.txt # 绨袍/布衣
sed -n '1730,1735p' 千家诗.txt # 血色裙
sed -n '2140,2150p' 千家诗.txt # 麻苎裙衫
sed -n '2172,2176p' 千家诗.txt # 解战袍
第5步:筛选与分类
筛选原则:
- 排除所有非服饰用法的颜色词("青天""白云"等)
- 排除"沾巾""带雨""引领"等泛化用法
- 仅保留明确描写服饰款式、材质、制度者
- 保留虽简短但有服饰研究价值的条目
第6步:对抗式审查
- 审: 第3轮142行匹配似多 → 改: 逐一核查,实际仅3条与服饰相关
- 审: 第2轮20行匹配似多 → 改: 逐一核查,实际仅6条与服饰相关
- 审: 第1轮37行匹配似多 → 改: 排除"沾巾""带雨"等,实际有效约18条
- 审: "红衣落尽渚莲愁"是否算服饰 → 改: 此处"红衣"指荷花,不算服饰
- 审: "蝶衣晒粉"是否算服饰 → 改: 蝶衣喻蝶翅,不算服饰
统计
- 有效服饰相关片段:约18条
- 服饰内容最丰富的单诗:王维《和贾舍人早朝大明宫之作》(含绛帻、翠云裘、衣冠、冕旒、衮龙5个服饰词)
- 与前两书对比:服饰内容极度稀少,约为十八家诗抄的1/8、十朝诗乘的1/3