《燕台花事录》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《燕台花事录》全部服饰相关内容,整理分类总结
Step 1: 文件信息
```bash wc -l -c 燕台花事录.txt
结果:93行,30458字节(约30KB)
```
Step 2: 第1轮grep — 核心服饰词
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 燕台花事录.txt
结果:约20行命中
```
Step 3: 第2轮grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 燕台花事录.txt
结果:0行命中
```
Step 4: 第3轮grep — 组合扩展词
前两轮结果已明确该书服饰内容性质(伶人妆束),无需搜扩展词。
Step 5: 排除审查
| 关键词 | 误命中场景 | 处理 |
|---|---|---|
| "锦" | "锦雯"为人名字 | 排除(人名用字) |
| "绣" | "绣帕" | 保留——刺绣工艺品 |
| "佩" | "佩洋表" | 保留——佩戴行为 |
| "裳" | "素衣裳" | 保留——服饰 |
| "衫" | "舞衫" | 保留——舞台服装 |
| "袖" | "窄袖短衣" | 保留——服饰部件 |
| "罗" | 无丝织品义命中 | — |
| "带" | 无腰带义命中 | — |
| "丝" | "丝桐"=琴 | 排除——乐器 |
| "纹" | 无服饰纹样义命中 | — |
经审查,保留13条有效服饰内容。
Step 6: sed提取关键段落
bash
sed -n '16,19p' 燕台花事录.txt # 妆束登场/丈夫为巾帼
sed -n '22,25p' 燕台花事录.txt # 妆束上场宛如好女
sed -n '26,29p' 燕台花事录.txt # 作出塞小鬟/舞衫歌扇/结束登场/粉黛
sed -n '71,76p' 燕台花事录.txt # 妆束换/窄袖短衣
sed -n '83,87p' 燕台花事录.txt # 红结束/素衣裳/旗下妆/佩洋表
Step 7: 分类整理
按4大类分组:舞台妆束、男扮女装与性别服饰转换、粉黛与修饰、日常服饰与佩饰
Step 8: 生成三份文件
燕台花事录_总结.md— 结构化总结+引用行号表燕台花事录_日志.md— 本文件燕台花事录_原文提取.md— 分类原文摘录
操作流程轨迹
文件信息93行/30KB → 第1轮核心词grep约20行命中 → 审查保留13条
→ 第2轮制度词grep 0行命中 → 无需第3轮
→ sed提取5段关键上下文 → 分类4大类 → 保存3份文件
关键发现
- 全书服饰内容以伶人舞台妆束为主,是清代梨园服饰的重要史料
- 男扮女装(丈夫为巾帼)为该书特色服饰内容
- 佩洋表体现晚清中西器物并用风尚