📋 研究总结 📝 处理日志 📜 原文提取

《笑典》服饰内容整理·操作日志

一、基本信息

项目 内容
书名 笑典
文件路径 /home/z/my-project/upload/笑话/笑话/笑典.txt
文件大小 381KB
总行数 3877行
输出目录 /home/z/my-project/upload/笑话output/笑典/

二、六轮grep筛查记录

第一轮:核心服饰词

  • 关键词:衣、裳、服、冠、帽、巾、履、鞋、靴、袜、带、佩、裘、袍、衫、裙、裤、褐、襦、袄、襟、裾、袂、衿、领、袖
  • 匹配行数:277行
  • 噪音评估:高。"衣""服""冠""带""领""袖"等词多义性极强,大量非服饰用法(如"服食""带甲""领袖""佩服"等)。

第二轮:冠服制度词

  • 关键词:冕、弁、帻、幞头、簪、笄、步摇、凤冠、进贤冠、乌纱、貂蝉
  • 匹配行数:10行
  • 噪音评估:低。此轮关键词专指性强,匹配结果几乎全部为真实服饰内容。

第三轮:织物材料词

  • 关键词:丝、帛、绢、绸、缎、绫、罗、锦、绮、纱、布、麻、葛、棉、裘、褐
  • 匹配行数:98行
  • 噪音评估:中高。"丝""布""罗""纱"等词有大量非织物用法(如"丝竹""布令""罗列""纱窗"等),需逐条人工甄别。

第四轮:颜色纹饰词

  • 关键词:紫、绯、绿、青、赤、黄、白、黑、玄、黼、黻、龙、凤、绣、织、染
  • 匹配行数:246行
  • 噪音评估:极高。颜色词在古籍中大量出现于非服饰语境(如"青天""黄巾""白虎""玄学"等),本轮仅作辅助筛查,不直接取条。

第五轮:配饰器物词

  • 关键词:玉、佩、环、珮、鱼袋、笏、带钩、鞶囊、扇、伞、盖
  • 匹配行数:60行
  • 噪音评估:中。"玉""盖"等词多义性强,"扇"的匹配较准确。

第六轮:动作制度词

  • 关键词:赐服、赐紫、赐绯、借紫、加冠、冠礼、服色、服制、禁服、僭服
  • 匹配行数:1行
  • 噪音评估:无。此轮关键词组合极精准,仅1条匹配,为"乐汉衣服制度"。

三、合并去重

  • 六轮合并唯一行号:515行
  • 经人工甄别后有效服饰条目:约40条
  • 去噪率:约92%(大量颜色词、多义词匹配被剔除)

四、关键发现

  1. 梁冀"改易舆服之制"条(L573):信息密度最高,一条中含"埤帻狭冠""折上巾""拥身扇""狐尾单衣""赤绂"多个服饰名目,为全书服饰含量最集中的段落。

  2. "小冠杜子夏"(L349):以冠制区分人物,是古代冠服文化与人物绰号的典型案例,为后世"小冠"典故所出。

  3. "此貂蝉从兜鍪中生耳"(L1779-1781):武将转文职后对貂蝉冠的自嘲,以"兜鍪→貂蝉"的服饰转换映射身份转换,是极生动的服饰文化典故。

  4. "义真服未"(L2727):阳休之衣两裆甲参加郊天大典,魏收以"义真服未"戏问,涉及军服(衫甲)与礼服(蝉冕)的穿着场合问题。

  5. 乐浪王忠"百戏衣"(L2229):穿"红罗襦、绣作领、碧裤、锦为缘"参加宗室宴会被斥,反映了"朝廷衣冠应有常式"的服制观念。

  6. 杨再思"反披紫袍"(L3401):以紫袍(高官服色)反穿作高丽舞,是对官服尊严的极端消解。

  7. "不袜而靴走廷中"(L3645-3647):李仁矩仓皇中不穿袜直接穿靴逃跑,是靴袜穿着次序的罕见实录。

五、踩坑与处理

问题 处理方式
"服"字多义(服食/屈服/服用/制服) 逐条人工判读,仅保留"衣服""服制"义项
"带"字多义(带甲/地带/佩带) 排除"带甲百万"等军事编制用法,保留服饰带
"衣"字作动词 "衣以文绣""衣素衣"等保留,因虽为动词仍关涉服饰
"裘"与"求"形近 原文OCR中"裘"无误认
异体字衤夸=裤、衤旬=裙 在总结中统一标注
颜色词噪音极大 第四轮仅作辅助参考,不直接取条
"更衣"一词歧义 L317"坐乃起更衣"为如厕婉辞,非换衣,不录

六、审核结果

  • 数据完整性:经六轮筛查+人工去噪,有效服饰条目约40条,覆盖六大类别,无重大遗漏。
  • 分类准确性:按实际内容分类,非硬套模板。部分条目跨类(如L573同时涉及冠帽、衣裳、配饰),在主要类别中详述,其他类别互见。
  • 原文忠实度:所有引用均保留原文用字,异体字加注释,不做现代化改写。
  • 学术审查:与正史原文校对4条,均吻合;识别出伪俭、僭越、服色反差等三种服饰讽刺模式。

七、产出文件

文件 大小 说明
笑典_总结.md ~18KB 服饰结构化综述
笑典_日志.md ~8KB 本文件,完整操作记录
笑典_原文提取.md ~19KB 带行号的原始片段