《警世通言》服饰内容提取 — 操作日志

操作时间:2026-04-19 18:26-18:43 操作者:AI Agent


操作流程

Step 1: 查缓存(未命中)

grep -rl "警世通言" ~/.openclaw/skills/rysxguji/knowledge/cached_texts/
→ CACHE_MISS

Step 2: 查殆知阁链接(命中)

grep "警世通言" ~/.openclaw/skills/rysxguji/daizhige_links.txt
→ https://daizhige.org/集藏/话本/警世通言.html

Step 3: 下载全文

bash dzgdown.sh "https://daizhige.org/集藏/话本/警世通言.html" 集藏__话本__警世通言.txt
→ Done: 1,148,229 bytes
→ 耗时约90秒(chromium渲染大文件)

Step 4: 统计关键词频次

关键词 命中行数 关键词 命中行数
260 193
298 160
462 绫罗 113
251 78
47 64
49 50
36 46
31 46
29 衣服 ~20
首饰 19 41
27 18
10 14
首饰 19 14

Step 5: 精确提取服饰描写

使用 Python 正则匹配复合服饰术语:

  • 身穿描述:8处
  • 头戴描述:9处
  • 色彩服饰(紫/红/白/青/绿+衣/袍/衫/裙):43处
  • 特定服饰(锦袍/绣裙/罗裙/道袍等):32处
  • 穿着描述:12处
  • 完整装扮:11处
  • 首饰饰品:11处
  • 织物面料:9处
  • 换衣动作:9处
  • 华丽装饰:1处

Step 6: sed 提取上下文

对50+关键行号使用 sed -n '起始行,结束行p' 提取完整上下文段落

Step 7: 分类整理

分为9大类:

  1. 华丽服饰描写(13处)
  2. 官服与朝服(4处)
  3. 普通/素雅服饰(8处)
  4. 贫寒/破旧服饰(8处)
  5. 织物面料(6处)
  6. 首饰饰品(5处)
  7. 服饰推动情节(5处)
  8. 婚嫁妆扮(4处)
  9. 服饰俗语/成语(5条)

关键发现

  1. 服饰推动叙事是本书最大特色——白娘子衣饰成赃、罗衫认亲、香罗帕定情、绣裹肚引秀秀,四处核心情节均由服饰物品驱动
  2. 三段式人物描写(头戴+身穿+脚穿)为话本小说标配程式
  3. 贫富衣着对比贯穿全书:石崇绫罗↔陶铁僧肩穿袖破、杜十娘花钿绣袄↔秃髻旧衫
  4. 字出现极多(113行),是最常用的高级织物
  5. 《警世通言》中"衣裳有缝"反复出现,作为"非鬼"的证明(白娘子、金明池女鬼等)

保存文件

文件 路径 大小
知识库总结 2026-04-19_1843_警世通言_服饰内容总结.md ~10KB
服饰原文 警世通言_服饰内容原文.md ~9.7KB
操作日志 2026-04-19_1843_警世通言_日志记录.md 本文件
原书缓存 skills/rysxguji/knowledge/cached_texts/集藏__话本__警世通言.txt 1,148,229 bytes

备注

  • 殆知阁版本有少量OCR错误(如"霞幢"应为"霞帔")
  • 前序任务《绿窗新语》在殆知阁/识典古籍/典津均未找到原著,该书为宋代皇都风月主人编,现代通行本为周楞伽笺注(上海古籍1991),2024年李剑国新校证版
  • 总字数控制在1M以内(原文提取+总结约20KB)