《龙文鞭影》服饰逐本整理日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 龙文鞭影 |
| 源文件 | /home/z/my-project/upload/启蒙蒙学/龙文鞭影.txt |
| 文件大小 | 18,931 字节 |
| 行数 | 305 行 |
| 处理日期 | 2026-03-04 |
处理流程
第一步:源文件探查
- 确认文件为纯文本,UTF-8编码
- 全书四卷,按韵部编排(一东至十五咸),四字对句体裁
- 文件较小(305行/19KB),可直接逐行检索
第二步:关键词检索
- 使用grep按服饰关键词词库逐字匹配
- 首轮匹配命中行数:约45行
- 排除误命中项:
- “韦文朱武”——“朱”为姓氏修饰词,非服色
- “罗敷陌上”——“罗敷”为人名
- “墨翟悲丝”——“丝”为比喻用,非服饰实体
- “葛洪负笈”——“葛”为人名
- “服虔赁作”——“服”为姓氏
- “王勃心织”——“织”为比喻
- “伯奇履霜”——“履”为动词”踩踏”
- “布算”“布重一诺”——“布”非织物义
- “麻姑”——“麻”为人名
- 颜色词(青、白、玄、赤、黄、紫等)散见甚多,多数非服饰语境,不予收入
第三步:逐条甄别
- 对每条命中项判别是否属于服饰语义
- 标注关键词在具体语境中的服饰含义
- 最终确认有效服饰条目:37条
第四步:分类整理
- 按7大类别归类:头饰、衣服、下装、鞋履、织物面料、佩饰、纺织活动
- 同一条目可能跨类(如”优孟衣冠”同时涉及衣与冠)
第五步:产出文件
- 龙文鞭影_原文提取.md:逐条摘录原文,标注关键词与行号
- 龙文鞭影_总结.md:分类统计与主题分析
- 龙文鞭影_日志.md:本文件,记录处理过程
关键决策记录
| 编号 | 问题 | 决策 | 理由 |
|---|---|---|---|
| 1 | 颜色词(青、白、玄、赤等)是否收入 | 不单独收入 | 数量过多且多数非服饰语境,如”白帝”“玄彝”“赤壁”等均非服饰 |
| 2 | “羽扇纶巾”是否收入 | 收入”纶巾”部分 | 纶巾为头饰,羽扇为器物,分开处理 |
| 3 | “牛衣”是否收入 | 收入 | 牛衣虽为覆牛草衣,但为衣物概念延伸,且为著名典故 |
| 4 | “绛帐”是否收入 | 收入 | 帐为织物制品,与纺织相关 |
| 5 | 玉器(玦、环、璧)是否收入 | 收入 | 为佩饰范畴,与服饰体系相关 |
| 6 | “织帘”“织屦”是否收入 | 收入 | 虽为纺织活动而非成品服饰,但直接关联服饰生产 |
| 7 | “锦囊”是否收入 | 收入 | 锦囊为锦缎所制,属织物制品 |
未能确认条目
| 条目 | 疑点 | 处理 |
|---|---|---|
| 嘉贞丝慢 | “丝”可能指丝弦乐器,非丝织品 | 未收入 |
| 献之书练 | “练”为白绢,但语境为书写材料 | 收入织物面料类 |
输出文件清单
| 文件 | 路径 |
|---|---|
| 原文提取 | /home/z/my-project/upload/启蒙蒙学output/龙文鞭影/龙文鞭影_原文提取.md |
| 总结 | /home/z/my-project/upload/启蒙蒙学output/龙文鞭影/龙文鞭影_总结.md |
| 日志 | /home/z/my-project/upload/启蒙蒙学output/龙文鞭影/龙文鞭影_日志.md |