全金元词 · 服饰整理日志
时间:2026-03-05
任务:词集逐本整理——全金元词服饰史料提取
一、操作流程
步骤1:查看文件规模
wc -l /home/z/my-project/upload/词集/词集/全金元词.txt
# 结果:40501行,属大型词集
步骤2:多轮grep关键词提取
按照服饰关键词词库分9轮grep:
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| 1 | 衣、裳、裘、冠、弁、冕、巾、帻、帽 | 835 |
| 2 | 簪、笄、钗、钿、环、佩、珮、带、绶、袍 | 660 |
| 3 | 襦、裙、衫、裤、褐、深衣、襕、袴、裈、履 | 226 |
| 4 | 舄、鞋、靴、袜、衮、黼黻、章服、品色、紫袍、绯袍 | 149 |
| 5 | 绿袍、青袍、白袍、赐服、锦、绮、绫、罗、缎、绢、帛 | 782 |
| 6 | 丝、绸、纱、缂丝、布衣、短褐、蓑、裙钗、钗裙、珠翠 | 396 |
| 7 | 翠翘、花钿、步摇、耳环、镯、钏、玉佩、鱼袋、笏、幞头 | 26 |
| 8 | 霞帔、云肩、抹胸、襕衫、直裰、道袍、鹤氅、褙子、半臂、比甲等 | 9 |
| 9 | 幂篱、面衣、首衣、足衣、香囊、荷包、伞、扇、画眉、螺黛等 | 123 |
步骤3:针对性深挖
对高价值关键词进行二次提取:
- 官服品色类:约30条有效
- 女子首饰类:约50条有效
- 裘皮冬服类:约15条有效
- 隐逸服饰类:约60条有效
- 道教服饰类:约25条有效
- 丝织品类:约40条有效
- 容妆类:约25条有效
步骤4:分类筛选
从总匹配中筛选最具服饰研究价值的片段,去除大量重复意象和非服饰义用法。
二、关键发现
- 全金元词中道教服饰文献极为丰富:全真道词数量庞大,纸袄麻衣、道袍蓑笠等描述远超其他词集。
- 官服品色承唐宋制:衮衣绣衣、紫绶金鱼、绯袍青衫等意象表明金元政权沿用唐宋服制体系。
- "青衫"意象高频出现:白居易《琵琶行》"江州司马青衫湿"成为词中最密集的服饰典故。
- 女子服饰偏重首饰妆容:钗、钿、步摇、翠翘等远多于衣裳描写。
- 北方皮裘文化突出:紫貂裘、黑貂裘等多次出现,反映金元北方民族的裘皮穿着传统。
三、关键踩坑记录
- "衮"字大量副词用法:"衮衮"在词中约出现15+次,多为"滚滚/连续不断"义,非服饰相关。
- "裘"字多作"菟裘":菟裘为隐居地名(出《左传》),非实指裘衣,约出现8次需排除。
- "衣"字泛指过多:如"衣冠""锦衣"等约半数为泛指或典故,需结合上下文判断。
- 道教术语中的服饰隐喻:如"朱裳""琼花"等在丹道词中为内丹术语,非实指服饰。
四、审核结果
- 提取完整性:✓ 9轮grep覆盖全部服饰关键词,未遗漏重要类别
- 分类准确性:✓ 已区分实指与隐喻、服饰义与非服饰义
- 上下文适当:✓ 大文件严格先grep定位再sed截取,未整本载入
- MD文件大小:✓ 每篇控制在20KB以内
- 核心价值:✓ 侧重官服品色、女子首饰、道教服饰三大高价值方向