《燕台花事录》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《燕台花事录》全部服饰相关内容,整理分类总结


Step 1: 文件信息

```bash wc -l -c 燕台花事录.txt

结果:93行,30458字节(约30KB)

```

Step 2: 第1轮grep — 核心服饰词

```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 燕台花事录.txt

结果:约20行命中

```

Step 3: 第2轮grep — 制度动作词

```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 燕台花事录.txt

结果:0行命中

```

Step 4: 第3轮grep — 组合扩展词

前两轮结果已明确该书服饰内容性质(伶人妆束),无需搜扩展词。

Step 5: 排除审查

关键词 误命中场景 处理
"锦" "锦雯"为人名字 排除(人名用字)
"绣" "绣帕" 保留——刺绣工艺品
"佩" "佩洋表" 保留——佩戴行为
"裳" "素衣裳" 保留——服饰
"衫" "舞衫" 保留——舞台服装
"袖" "窄袖短衣" 保留——服饰部件
"罗" 无丝织品义命中
"带" 无腰带义命中
"丝" "丝桐"=琴 排除——乐器
"纹" 无服饰纹样义命中

经审查,保留13条有效服饰内容。

Step 6: sed提取关键段落

bash sed -n '16,19p' 燕台花事录.txt # 妆束登场/丈夫为巾帼 sed -n '22,25p' 燕台花事录.txt # 妆束上场宛如好女 sed -n '26,29p' 燕台花事录.txt # 作出塞小鬟/舞衫歌扇/结束登场/粉黛 sed -n '71,76p' 燕台花事录.txt # 妆束换/窄袖短衣 sed -n '83,87p' 燕台花事录.txt # 红结束/素衣裳/旗下妆/佩洋表

Step 7: 分类整理

按4大类分组:舞台妆束、男扮女装与性别服饰转换、粉黛与修饰、日常服饰与佩饰

Step 8: 生成三份文件


操作流程轨迹

文件信息93行/30KB → 第1轮核心词grep约20行命中 → 审查保留13条 → 第2轮制度词grep 0行命中 → 无需第3轮 → sed提取5段关键上下文 → 分类4大类 → 保存3份文件

关键发现