《警世通言》服饰内容提取 — 操作日志
操作时间:2026-04-19 18:26-18:43 操作者:AI Agent
操作流程
Step 1: 查缓存(未命中)
grep -rl "警世通言" ~/.openclaw/skills/rysxguji/knowledge/cached_texts/
→ CACHE_MISS
Step 2: 查殆知阁链接(命中)
grep "警世通言" ~/.openclaw/skills/rysxguji/daizhige_links.txt
→ https://daizhige.org/集藏/话本/警世通言.html
Step 3: 下载全文
bash dzgdown.sh "https://daizhige.org/集藏/话本/警世通言.html" 集藏__话本__警世通言.txt
→ Done: 1,148,229 bytes
→ 耗时约90秒(chromium渲染大文件)
Step 4: 统计关键词频次
| 关键词 | 命中行数 | 关键词 | 命中行数 |
|---|---|---|---|
| 衣 | 260 | 带 | 193 |
| 玉 | 298 | 红 | 160 |
| 金 | 462 | 绫罗 | 113 |
| 银 | 251 | 锦 | 78 |
| 冠 | 47 | 珠 | 64 |
| 衫 | 49 | 翠 | 50 |
| 帽 | 36 | 绣 | 46 |
| 鞋 | 31 | 丝 | 46 |
| 裳 | 29 | 衣服 | ~20 |
| 首饰 | 19 | 袍 | 41 |
| 坠 | 27 | 靴 | 18 |
| 钗 | 10 | 袜 | 14 |
| 首饰 | 19 | 履 | 14 |
Step 5: 精确提取服饰描写
使用 Python 正则匹配复合服饰术语:
- 身穿描述:8处
- 头戴描述:9处
- 色彩服饰(紫/红/白/青/绿+衣/袍/衫/裙):43处
- 特定服饰(锦袍/绣裙/罗裙/道袍等):32处
- 穿着描述:12处
- 完整装扮:11处
- 首饰饰品:11处
- 织物面料:9处
- 换衣动作:9处
- 华丽装饰:1处
Step 6: sed 提取上下文
对50+关键行号使用 sed -n '起始行,结束行p' 提取完整上下文段落
Step 7: 分类整理
分为9大类:
- 华丽服饰描写(13处)
- 官服与朝服(4处)
- 普通/素雅服饰(8处)
- 贫寒/破旧服饰(8处)
- 织物面料(6处)
- 首饰饰品(5处)
- 服饰推动情节(5处)
- 婚嫁妆扮(4处)
- 服饰俗语/成语(5条)
关键发现
- 服饰推动叙事是本书最大特色——白娘子衣饰成赃、罗衫认亲、香罗帕定情、绣裹肚引秀秀,四处核心情节均由服饰物品驱动
- 三段式人物描写(头戴+身穿+脚穿)为话本小说标配程式
- 贫富衣着对比贯穿全书:石崇绫罗↔陶铁僧肩穿袖破、杜十娘花钿绣袄↔秃髻旧衫
- 罗字出现极多(113行),是最常用的高级织物
- 《警世通言》中"衣裳有缝"反复出现,作为"非鬼"的证明(白娘子、金明池女鬼等)
保存文件
| 文件 | 路径 | 大小 |
|---|---|---|
| 知识库总结 | 2026-04-19_1843_警世通言_服饰内容总结.md | ~10KB |
| 服饰原文 | 警世通言_服饰内容原文.md | ~9.7KB |
| 操作日志 | 2026-04-19_1843_警世通言_日志记录.md | 本文件 |
| 原书缓存 | skills/rysxguji/knowledge/cached_texts/集藏__话本__警世通言.txt | 1,148,229 bytes |
备注
- 殆知阁版本有少量OCR错误(如"霞幢"应为"霞帔")
- 前序任务《绿窗新语》在殆知阁/识典古籍/典津均未找到原著,该书为宋代皇都风月主人编,现代通行本为周楞伽笺注(上海古籍1991),2024年李剑国新校证版
- 总字数控制在1M以内(原文提取+总结约20KB)