《诗序补义》服饰逐本整理日志
整理日期:2026-05-09
一、文件信息
| 项目 | 内容 |
|---|---|
| 书名 | 诗序补义 |
| 文件路径 | /home/z/my-project/upload/诗经/诗序补义.txt |
| 文件行数 | 2568 |
| 文件编码 | UTF-8 (含少量编码异常字符,以errors='replace'处理) |
| 内容概要 | 清代姜文灿撰,钦定四库全书经部三类,诗序补义目录诗类 |
二、Grep检索统计
第一轮:衣裳裘弁佩葛絺绤舄芾
- [衣] 命中 82 行
- [裳] 命中 27 行
- [裘] 命中 27 行
- [弁] 命中 20 行
- [佩] 命中 14 行
- [葛] 命中 38 行
- [絺] 命中 4 行
- [绤] 命中 3 行
- [舄] 命中 3 行
- [芾] 命中 4 行
- 小计:222 行
第二轮:丝锦帛素麻褐缟纩绵
- [丝] 命中 10 行
- [锦] 命中 11 行
- [帛] 命中 7 行
- [素] 命中 37 行
- [麻] 命中 8 行
- [褐] 命中 2 行
- [缟] 命中 2 行
- [纩] 命中 0 行
- [绵] 命中 14 行
- 小计:91 行
第三轮:冠冕帻巾帽
- [冠] 命中 29 行
- [冕] 命中 4 行
- [帻] 命中 0 行
- [巾] 命中 1 行
- [帽] 命中 0 行
- 小计:34 行
第四轮:琼琚瑶珩璜充耳琇莹
- [琼] 命中 2 行
- [琚] 命中 0 行
- [瑶] 命中 1 行
- [珩] 命中 0 行
- [璜] 命中 0 行
- [充耳] 命中 8 行
- [琇] 命中 1 行
- [莹] 命中 3 行
- 小计:15 行
第五轮:玄朱青黄白赤(过滤服饰上下文)
说明:颜色词为常见字,第五轮仅保留与服饰上下文相关的行。过滤条件:行中同时包含衣/裳/裘/冠/冕/弁/服/佩/芾/舄等服饰词。
- [玄] 服饰相关命中 0 行
- [朱] 服饰相关命中 44 行
- [青] 服饰相关命中 3 行
- [黄] 服饰相关命中 12 行
- [白] 服饰相关命中 18 行
- [赤] 服饰相关命中 9 行
- 小计:86 行
第六轮:赐服/衣之/服之/冠之
- [赐服] 命中 0 行
- [衣之] 命中 11 行
- [服之] 命中 15 行
- [冠之] 命中 4 行
- 小计:30 行
汇总
- 六轮总命中(含重复):478 行
- 去重后总命中行数:260 行
三、关键词命中为零的词项
- 纩(丝绵,本书未提及)
- 帻(头巾,本书未提及)
- 帽(帽子,本书未提及)
- 琚、珩、璜(玉佩部件,本书未提及)
- 赐服(本书用'赐衣'表述)
- 玄(过滤后无服饰相关条目)
四、处理说明
- 编码处理:原始文件含少量编码异常字节,使用Python open()的errors='replace'参数处理。
- 颜色词过滤:第五轮颜色词(朱108行、黄57行、白66行、赤20行)因命中量过大且多与服饰无关,追加服饰上下文过滤,仅保留同时含服饰关键词的行。
- 内容筛选:从命中行中人工判断服饰相关性,去除纯人名、地名、引文等非服饰条目。
- 分类原则:按服饰类型分为七大类,同一行可归入多个类别。
- 大小控制:三篇MD均控制在20KB以内。
五、分类统计
| 分类 | 命中行数 |
|---|---|
| 衣裳制度 | 113 |
| 冠冕弁服 | 52 |
| 佩饰玉器 | 24 |
| 织物材质 | 80 |
| 鞋履芾饰 | 45 |
| 服饰颜色 | 72 |
| 赐服与服制 | 26 |