《金瓶梅》服饰整理操作日志

基本信息

项目 内容
输入文件 /home/z/my-project/upload/part4/金瓶梅.txt
输出目录 /home/z/my-project/upload/4小说output/金瓶梅/
文件规模 3376行,约2.29MB
处理日期 2026-03-04

操作流程

第一步:文件验证与目录创建

wc -l /home/z/my-project/upload/part4/金瓶梅.txt    # 结果:3376行
wc -c /home/z/my-project/upload/part4/金瓶梅.txt    # 结果:2293960字节
mkdir -p /home/z/my-project/upload/4小说output/金瓶梅/

第二步:关键词检索统计

使用ripgrep对七类关键词分别检索:

关键词类别 检索命令 命中行数
核心衣类 rg -n '衣裳\|袍\|衫\|裙\|袄\|裘\|冠\|冕\|弁\|帽\|巾\|帻\|履\|舄\|靴\|鞋\|带\|佩\|笏\|绶' 797
面料材质 rg -n '丝\|帛\|绢\|绸\|缎\|绫\|罗\|纱\|锦\|绮\|缂' 571
纹饰 rg -n '绣\|纹\|黼\|黻\|龙凤\|蟒\|鹤\|狮' 234
色彩 rg -n '紫\|绯\|绿\|青\|朱\|赭\|玄' 492
配饰 rg -n '簪\|钗\|钏\|镯\|环\|珠\|玉\|翡翠\|珊瑚\|鱼袋\|荷包\|扇' 838
品类 rg -n '衣裳\|长袍\|短衫\|道袍\|蟒袍\|朝服\|公服\|丧服\|僧衣\|甲铠\|甲胄' 148
动作 rg -n '着衣\|更衣\|披衣\|解衣\|脱衣\|穿衣\|衣冠\|赐服\|赐紫\|赐绯' 103

第三步:高价值场景定向提取

对以下重点品类进行定向检索,获取上下文:

  1. 官服体系rg -n '蟒衣|蟒袍|龙袍|官绿|大红蟒|狮蛮玉带|金镶' → 获取蔡太师府、何太监赠衣等核心场景
  2. 女性上衣rg -n '比甲|对衿|道袍|深衣|褶子|衲袄|禅衣|氅' → 获取金莲、瓶儿、春梅等典型着装描写
  3. 头面首饰rg -n '髻|簪儿|钗|钏|坠子|分心|挑心' → 获取金簪、金丝髻、分心等描写

第四步:精选典型片段

从数百条命中中精选最具分析价值的片段,按以下标准筛选: - 代表性:该类别最具典型意义的描写 - 完整性:服饰描写有足够的上下文 - 分析价值:能支撑叙事功能分析的片段 - 去重:同类描写只选最精彩者

精选结果:官服5条、女性日常8条、男性日常5条、头面首饰6条、丧服3条、面料材质3条,共约30条代表性片段。

第五步:分类撰写三份MD文档

  1. 金瓶梅_总结.md:结构化综述 + 对抗式学术审查
  2. 金瓶梅_日志.md:本文件,操作命令与流程记录
  3. 金瓶梅_原文提取.md:精选带行号的代表性片段

第六步:文件大小验证

wc -c /home/z/my-project/upload/4小说output/金瓶梅/金瓶梅_总结.md
wc -c /home/z/my-project/upload/4小说output/金瓶梅/金瓶梅_日志.md
wc -c /home/z/my-project/upload/4小说output/金瓶梅/金瓶梅_原文提取.md

精简策略说明

本次重做的核心改进:

  1. 原文提取精简:不再逐条列出所有命中行,每类别精选3-5条最具代表性片段
  2. 总结结构化:以分析框架替代大段引文,控制总字数
  3. 日志简明化:仅记录关键操作命令和统计结果,不逐条罗列

质量检查清单