《西湖二集》服饰整理工作日志
基本信息
- 书名:西湖二集
- 作者:明·周楫编纂
- 文件路径:/home/z/my-project/upload/part4/西湖二集.txt
- 文件规模:1885行,约973KB
- 输出目录:/home/z/my-project/upload/4小说output/西湖二集/
- 处理日期:2025年
一、处理流程
第一步:文件检视
- 确认文件存在,1885行,纯文本格式
- 确认全书三十四卷结构完整
- 创建输出目录
第二步:核心词多轮grep
第一轮:衣裳袍衫裙袄裘
- 命令:
rg -n '衣[裳袍衫]|袍|衫|裙|袄|裘'
- 结果:约80条匹配
- 重要发现:黄袍加身、衮龙袍、绿襕袍、百衲绽衣、蟒袍、衣锦还乡、道袍等
第二轮:冠冕弁帽巾帻
- 命令:
rg -n '冠|冕|弁|帽' 及 rg -n '巾|帻'
- 结果:约100条匹配(冠冕较泛,含"冠军"等非服饰用法)
- 重要发现:冲天冠、冕旒、软翅唐巾、九华仙巾、乌纱帽、头巾、网巾等
第三轮:履舄靴鞋带佩笏绶
- 命令:
rg -n '履|舄|靴|鞋' 及 rg -n '带|佩|笏|绶'
- 结果:约80条匹配("带"字较泛,含大量非服饰用法)
- 重要发现:无忧履、五云飞凤履、朝靴、绣鞋、白玉带、金束带、蟒衣玉带等
第三步:面料材质词grep
- 命令:
rg -n '绫|罗|纱|锦|绮|缂|绢|绸|缎|帛'
- 结果:约80条匹配
- 重要发现:方锦纱袍、销金彩缎、锦绣、缯素、细葛、绉纱、紫番罗、越罗等
第四步:纹饰词、色彩词、品类词grep
- 命令:
rg -n '绣|纹|黼|黻|龙[袍凤]|蟒[袍]' 及 rg -n '紫[袍衣衫]|绯|朝服|公服|道袍|僧衣|甲铠|甲胄'
- 结果:约50条匹配
- 重要发现:五彩嵌金衮龙袍、绣幕、绣鞋、缁色道袍、紫袍金带、绯衣等
第五步:配饰词、动作词grep
- 命令:
rg -n '簪|钗|钏|镯|珠|玉|翡翠|珊瑚' 及 rg -n '赐服|赐紫|赐绯|着衣|更衣|披衣|解衣|脱衣|穿衣|衣冠'
- 结果:约40条匹配
- 重要发现:金凤绣鞋、翠钿、珠翠、赐衣紫、解衣、解带脱衣、衣冠等
二、关键词命中统计
| 关键词类别 |
关键词数 |
命中条目数 |
有效服饰条目 |
| 核心词-衣袍裙衫 |
7 |
~80 |
~50 |
| 核心词-冠冕弁帽 |
4 |
~60 |
~25 |
| 核心词-巾帻 |
2 |
~40 |
~15 |
| 核心词-履靴鞋 |
3 |
~40 |
~15 |
| 核心词-带佩笏绶 |
4 |
~80 |
~15 |
| 面料材质词 |
16 |
~80 |
~25 |
| 纹饰词 |
5 |
~50 |
~20 |
| 色彩词 |
5 |
~30 |
~12 |
| 品类词 |
8 |
~20 |
~10 |
| 配饰词 |
10 |
~40 |
~20 |
| 动作词 |
10 |
~20 |
~10 |
| 合计 |
74 |
~540 |
~217 |
三、去重与筛选说明
- "冠"字:大量出现"冠军""冠绝""冠冕"等非服饰用法,人工筛选保留"冠冕""冲天冠""冕旒""冠服"等
- "带"字:极高频字,大量非服饰用法("带乞""带领"等),仅保留"白玉带""金束带""玉带"等服饰用法
- "佩"字:部分为"佩丁东"等拟声词,筛选保留"玉佩""佩带香"等
- "巾"字:部分为"汗巾""罗帕裹巾"等,属于配饰范畴
- "绣"字:大量"锦绣"为文学修辞,筛选保留"绣鞋""绣幕""绣旗"等实物用法
四、难点与说明
- 本书为话本小说集,各卷故事独立,服饰描写分散于34卷中,单卷密度不高
- 明代编纂者写宋事,服饰描写多含明代视角,需注意时代差异
- 部分服饰描写为诗词中用典(如"莱子衣裳宫锦窄"),需区分叙事与用典
- "黄袍加身"在本集中出现两次(宋太祖、济王),意义截然不同
五、输出文件
| 文件名 |
内容 |
大小限制 |
| 西湖二集_总结.md |
服饰信息分类总结与分析 |
<20KB |
| 西湖二集_日志.md |
本文件,工作流程记录 |
<20KB |
| 西湖二集_原文提取.md |
服饰相关原文摘录 |
<20KB |