《龙文鞭影》服饰逐本整理日志

基本信息

项目 内容
书名 龙文鞭影
源文件 /home/z/my-project/upload/启蒙蒙学/龙文鞭影.txt
文件大小 18,931 字节
行数 305 行
处理日期 2026-03-04

处理流程

第一步:源文件探查

  • 确认文件为纯文本,UTF-8编码
  • 全书四卷,按韵部编排(一东至十五咸),四字对句体裁
  • 文件较小(305行/19KB),可直接逐行检索

第二步:关键词检索

  • 使用grep按服饰关键词词库逐字匹配
  • 首轮匹配命中行数:约45行
  • 排除误命中项:
  • “韦文朱武”——“朱”为姓氏修饰词,非服色
  • “罗敷陌上”——“罗敷”为人名
  • “墨翟悲丝”——“丝”为比喻用,非服饰实体
  • “葛洪负笈”——“葛”为人名
  • “服虔赁作”——“服”为姓氏
  • “王勃心织”——“织”为比喻
  • “伯奇履霜”——“履”为动词”踩踏”
  • “布算”“布重一诺”——“布”非织物义
  • “麻姑”——“麻”为人名
  • 颜色词(青、白、玄、赤、黄、紫等)散见甚多,多数非服饰语境,不予收入

第三步:逐条甄别

  • 对每条命中项判别是否属于服饰语义
  • 标注关键词在具体语境中的服饰含义
  • 最终确认有效服饰条目:37条

第四步:分类整理

  • 按7大类别归类:头饰、衣服、下装、鞋履、织物面料、佩饰、纺织活动
  • 同一条目可能跨类(如”优孟衣冠”同时涉及衣与冠)

第五步:产出文件

  • 龙文鞭影_原文提取.md:逐条摘录原文,标注关键词与行号
  • 龙文鞭影_总结.md:分类统计与主题分析
  • 龙文鞭影_日志.md:本文件,记录处理过程

关键决策记录

编号 问题 决策 理由
1 颜色词(青、白、玄、赤等)是否收入 不单独收入 数量过多且多数非服饰语境,如”白帝”“玄彝”“赤壁”等均非服饰
2 “羽扇纶巾”是否收入 收入”纶巾”部分 纶巾为头饰,羽扇为器物,分开处理
3 “牛衣”是否收入 收入 牛衣虽为覆牛草衣,但为衣物概念延伸,且为著名典故
4 “绛帐”是否收入 收入 帐为织物制品,与纺织相关
5 玉器(玦、环、璧)是否收入 收入 为佩饰范畴,与服饰体系相关
6 “织帘”“织屦”是否收入 收入 虽为纺织活动而非成品服饰,但直接关联服饰生产
7 “锦囊”是否收入 收入 锦囊为锦缎所制,属织物制品

未能确认条目

条目 疑点 处理
嘉贞丝慢 “丝”可能指丝弦乐器,非丝织品 未收入
献之书练 “练”为白绢,但语境为书写材料 收入织物面料类

输出文件清单

文件 路径
原文提取 /home/z/my-project/upload/启蒙蒙学output/龙文鞭影/龙文鞭影_原文提取.md
总结 /home/z/my-project/upload/启蒙蒙学output/龙文鞭影/龙文鞭影_总结.md
日志 /home/z/my-project/upload/启蒙蒙学output/龙文鞭影/龙文鞭影_日志.md