《金瓶梅》服饰整理操作日志
基本信息
| 项目 | 内容 |
|---|---|
| 输入文件 | /home/z/my-project/upload/part4/金瓶梅.txt |
| 输出目录 | /home/z/my-project/upload/4小说output/金瓶梅/ |
| 文件规模 | 3376行,约2.29MB |
| 处理日期 | 2026-03-04 |
操作流程
第一步:文件验证与目录创建
wc -l /home/z/my-project/upload/part4/金瓶梅.txt # 结果:3376行
wc -c /home/z/my-project/upload/part4/金瓶梅.txt # 结果:2293960字节
mkdir -p /home/z/my-project/upload/4小说output/金瓶梅/
第二步:关键词检索统计
使用ripgrep对七类关键词分别检索:
| 关键词类别 | 检索命令 | 命中行数 |
|---|---|---|
| 核心衣类 | rg -n '衣裳\|袍\|衫\|裙\|袄\|裘\|冠\|冕\|弁\|帽\|巾\|帻\|履\|舄\|靴\|鞋\|带\|佩\|笏\|绶' |
797 |
| 面料材质 | rg -n '丝\|帛\|绢\|绸\|缎\|绫\|罗\|纱\|锦\|绮\|缂' |
571 |
| 纹饰 | rg -n '绣\|纹\|黼\|黻\|龙凤\|蟒\|鹤\|狮' |
234 |
| 色彩 | rg -n '紫\|绯\|绿\|青\|朱\|赭\|玄' |
492 |
| 配饰 | rg -n '簪\|钗\|钏\|镯\|环\|珠\|玉\|翡翠\|珊瑚\|鱼袋\|荷包\|扇' |
838 |
| 品类 | rg -n '衣裳\|长袍\|短衫\|道袍\|蟒袍\|朝服\|公服\|丧服\|僧衣\|甲铠\|甲胄' |
148 |
| 动作 | rg -n '着衣\|更衣\|披衣\|解衣\|脱衣\|穿衣\|衣冠\|赐服\|赐紫\|赐绯' |
103 |
第三步:高价值场景定向提取
对以下重点品类进行定向检索,获取上下文:
- 官服体系:
rg -n '蟒衣|蟒袍|龙袍|官绿|大红蟒|狮蛮玉带|金镶'→ 获取蔡太师府、何太监赠衣等核心场景 - 女性上衣:
rg -n '比甲|对衿|道袍|深衣|褶子|衲袄|禅衣|氅'→ 获取金莲、瓶儿、春梅等典型着装描写 - 头面首饰:
rg -n '髻|簪儿|钗|钏|坠子|分心|挑心'→ 获取金簪、金丝髻、分心等描写
第四步:精选典型片段
从数百条命中中精选最具分析价值的片段,按以下标准筛选: - 代表性:该类别最具典型意义的描写 - 完整性:服饰描写有足够的上下文 - 分析价值:能支撑叙事功能分析的片段 - 去重:同类描写只选最精彩者
精选结果:官服5条、女性日常8条、男性日常5条、头面首饰6条、丧服3条、面料材质3条,共约30条代表性片段。
第五步:分类撰写三份MD文档
- 金瓶梅_总结.md:结构化综述 + 对抗式学术审查
- 金瓶梅_日志.md:本文件,操作命令与流程记录
- 金瓶梅_原文提取.md:精选带行号的代表性片段
第六步:文件大小验证
wc -c /home/z/my-project/upload/4小说output/金瓶梅/金瓶梅_总结.md
wc -c /home/z/my-project/upload/4小说output/金瓶梅/金瓶梅_日志.md
wc -c /home/z/my-project/upload/4小说output/金瓶梅/金瓶梅_原文提取.md
精简策略说明
本次重做的核心改进:
- 原文提取精简:不再逐条列出所有命中行,每类别精选3-5条最具代表性片段
- 总结结构化:以分析框架替代大段引文,控制总字数
- 日志简明化:仅记录关键操作命令和统计结果,不逐条罗列
质量检查清单
- [x] 三份MD文件均已生成
- [x] 每份文件≤20KB(20480字节)
- [x] 关键词覆盖完整(7类关键词全部检索)
- [x] 原文片段标注行号
- [x] 总结包含对抗式学术审查
- [x] 日志记录完整操作流程