《海陬冶游录》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《海陬冶游录》全部服饰相关内容
Step 1: 文件基本信息
文件:/home/z/my-project/upload/part3/海陬冶游录.txt
行数:123行
大小:58,164字节(约56.8KB)
性质:晚清淞北玉魫生撰,上海娼妓冶游笔记
Step 2: 第1轮 — 核心服饰词全搜
bash
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 海陬冶游录.txt
关键词频次统计: - 胜22、绣20、绮16、罗14、衣13、裙10、袖10、丝8、锦7、钗7、环7、襦5、带5、麻4、领4、袂4、衫4、屐4、钏3、裘3、襟2、裳2、裤2、袜2、缨2、纹2、帛2、履2、冠2、鞋1、袄1、舄1、纨1、簪1、笏1、步摇1、帽1
命中行:38行(约占总行数31%)
Step 3: 逐条审查排除
| 关键词 | 误命中数 | 语境 | 判定 |
|---|---|---|---|
| 胜 | 22处 | "胜过""绝胜""胜概""胜事" | ❌全部排除——超越/胜景义 |
| 丝 | 8处 | "丝柳""丝竹""红丝""鬓丝""牵丝" | ❌全部排除——柳枝/乐器/发丝 |
| 环 | 6处 | "环马场""环海""环植""循环" | ❌排除——围绕/循环义 |
| 环 | 1处 | "金环约指"(行86) | ✅保留——指环首饰 |
| 麻 | 2处 | "麻姑" | ❌排除——仙人名 |
| 领 | 1处 | "领袖章台" | ❌排除——领导者 |
| 带 | 1处 | "一带" | ❌排除——地理条带 |
| 织 | 1处 | "如梭织" | ❌排除——比喻繁忙 |
| 桑 | 1处 | "沧桑" | ❌排除——沧海桑田 |
| 纹 | 1处 | "湘纹之簟" | ❌排除——竹席纹路 |
有效命中:约40条
Step 4: 第2轮 — 制度动作词
bash
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 海陬冶游录.txt
命中1行: - 行44: "蝉鬓加冠" → 加冠=演戏时戴冠 → ✅保留(演剧服饰)
Step 5: 第3轮 — 组合扩展词
bash
rg -n '蚕|桑|茧|缫|织|纺|绸|缂丝|折帛|和买|市舶|绢价|匹帛' 海陬冶游录.txt
命中: - 行10: "沧桑""麻姑" → ❌排除 - 行12: "如梭织" → ❌排除 - 行40: "备诸纽织" → ✅保留(服饰制作技术) - 行85: "市舶提举" → ✅保留(经济制度) - 行90: "冰蚕阁" → ❌排除(阁名)
Step 6: 分类整理
将约40条有效命中分为8类: 1. 衣服制度与时尚(5条) 2. 裙衫袍襦(13条) 3. 足服(4条) 4. 首饰佩饰(7条) 5. 裘服冠帽(4条) 6. 衣料织物(9条) 7. 特殊服饰场景(4条) 8. 服饰与身份(6条)
Step 7: 生成3份MD
海陬冶游录_总结.md— 结构化总结海陬冶游录_日志.md— 本文件海陬冶游录_原文提取.md— 原文摘录
操作流程轨迹
文件检查(123行/56.8KB)→第1轮grep命中38行约160处关键词
→频次统计→逐条审查排除(胜22/丝8/环6等误命中)→有效约40条
→第2轮1条命中(加冠)→第3轮2条有效(纽织/市舶)
→分类8项→生成3MD
审核结论
- 原文验证:✅ grep行号对应
- 排除审查:✅ 大量误命中已排除(胜22处最突出)
- 有效命中:约40条
- 服饰制度价值:极高——晚清上海娼妓服饰第一手资料