《诗序补义》服饰逐本整理日志

整理日期:2026-05-09

一、文件信息

项目内容
书名诗序补义
文件路径/home/z/my-project/upload/诗经/诗序补义.txt
文件行数2568
文件编码UTF-8 (含少量编码异常字符,以errors='replace'处理)
内容概要清代姜文灿撰,钦定四库全书经部三类,诗序补义目录诗类

二、Grep检索统计

第一轮:衣裳裘弁佩葛絺绤舄芾

第二轮:丝锦帛素麻褐缟纩绵

第三轮:冠冕帻巾帽

第四轮:琼琚瑶珩璜充耳琇莹

第五轮:玄朱青黄白赤(过滤服饰上下文)

说明:颜色词为常见字,第五轮仅保留与服饰上下文相关的行。过滤条件:行中同时包含衣/裳/裘/冠/冕/弁/服/佩/芾/舄等服饰词。

第六轮:赐服/衣之/服之/冠之

汇总

三、关键词命中为零的词项

四、处理说明

  1. 编码处理:原始文件含少量编码异常字节,使用Python open()的errors='replace'参数处理。
  2. 颜色词过滤:第五轮颜色词(朱108行、黄57行、白66行、赤20行)因命中量过大且多与服饰无关,追加服饰上下文过滤,仅保留同时含服饰关键词的行。
  3. 内容筛选:从命中行中人工判断服饰相关性,去除纯人名、地名、引文等非服饰条目。
  4. 分类原则:按服饰类型分为七大类,同一行可归入多个类别。
  5. 大小控制:三篇MD均控制在20KB以内。

五、分类统计

分类命中行数
衣裳制度113
冠冕弁服52
佩饰玉器24
织物材质80
鞋履芾饰45
服饰颜色72
赐服与服制26