操作日志 — 2026-04-19 18:49 · 《红楼梦》服饰篇全文提取

查询信息

  • 主题:《红楼梦》服饰相关全部内容提取、整理、分类、总结
  • 原始URL:https://daizhige.org/集藏/小说/红楼梦.html
  • 操作时间:2026-04-19 18:49-19:30
  • 全书规模:约120回,2,597,194字节(2.6MB)

流程轨迹

Step 0: 缓存检查

  • ls cached_texts/ | grep 红楼 → 未命中
  • grep "红楼梦" daizhige_links.txt → 命中

Step 1: 下载全文

  • 方法:chromium --headless --dump-dom + python3 提取纯文本
  • 输出:集藏__小说__红楼梦.txt — 2,597,194 bytes
  • 耗时:约3分钟(全书极大)

Step 2: 服饰关键词搜索

  • 50+关键词统计,高命中词:钗434行、环126行、衣服108行、锦83行、妆87行、绣72行、皮74行、裳70行、罗62行、纱57行、衫53行

Step 3: 精确提取

  • 搜索"怎生打扮""头裹.*身穿""雀金裘""凫靥裘""软烟罗""斗篷""鹤氅""蟒衣""抹胸""水田"等
  • grep -n -B2 -A5 提取上下文
  • 人工阅读数百段,筛选核心服饰描写

Step 4: 整理分类

  • 按人物:宝玉、黛玉、宝钗、凤姐、湘云、袭人、鸳鸯、芳官、尤三姐、宝琴、贾母
  • 按类别:珍贵织物、服饰信物、色彩体系、身份阶层、季节穿着
  • 重点识别:雀金裘、凫靥裘、软烟罗等名贵织物

Step 5: 生成输出文件

输出文件

文件 路径 大小 说明
服饰内容原文 knowledge/yuanwen/红楼梦_服饰内容原文.md 5.5KB 21个分类的服饰描写
内容总结 knowledge/2026-04-19_1849_红楼梦_服饰内容总结.md 4.7KB 结构化知识库
操作日志 knowledge/log/2026-04-19_1849_红楼梦_日志记录.md 本文件 操作记录
全书缓存 knowledge/cached_texts/集藏__小说__红楼梦.txt 2.6MB 全书文本

关键发现

  1. 雀金裘:哦啰斯国(俄罗斯)孔雀毛织的,"就剩下了这一件"——晴雯病中补裘力尽而亡
  2. 凫靥裘:野鸭子头上的毛,宝琴所披,全书第二件名贵裘衣
  3. 软烟罗:贾母纠正凤姐——不是蝉翼纱,而是"软烟罗","比你们的年纪还大",只有四色
  4. 凤姐第三回出场:全书最华丽的服饰描写——金丝八宝攒珠髻、朝阳五凤挂珠钗、缕金百蝶穿花袄
  5. 湘云男装:"蜂腰猿背,鹤势螂形"——最具英气的女子装束
  6. 尤三姐:大红袄子半掩半开、葱绿抹胸、一痕雪脯——最性感的服饰描写
  7. 服饰信物极多:通灵玉、金锁、金麒麟、汗巾、旧帕、雀金裘、虾须镯、九龙佩等均为关键情节道具
  8. 色彩体系完整:大红(最常见,宝玉凤姐)→石青(沉稳)→素色(宝钗)→艳色(活泼)
  9. 织物种类极丰:雀金呢、凫靥裘、软烟罗、哆罗呢、猩猩毡、羽纱、刻丝、洋缎等数十种
  10. 服饰=性格:凤姐金翠辉煌=烈火烹油,宝钗莲青素色=端庄内敛,湘云男装=豪爽洒脱

审核结果

  • ✅ 原文从缓存文件中提取,真实可靠
  • ✅ 按回目标注出处
  • ✅ 核心名段(凤姐出场、湘云男装、雀金裘、软烟罗等)完整提取
  • ✅ 保存三份文件