《玄怪录》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《玄怪录》全部服饰相关内容,整理分类总结
Step 0: 文件基本信息
```bash wc -l -c /home/z/my-project/upload/part3/玄怪录.txt
结果:473行 / 122081字节
文本性质:唐·牛僧孺撰志怪小说集
```
Step 1: 读取关键词词库
```bash
词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md
包含:核心服饰词、制度动作词、组合扩展词、排除规则表
```
Step 2: 第1轮 grep — 核心服饰词
bash
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/玄怪录.txt
第1轮命中统计
- 匹配行数:117行(大量命中)
- 主要命中词:衣(~70次)、冠(~15次)、裳/裙/衫/袍/帔/簪/钗/笏/靴/履/丝/绢/罗/锦/绣/帛/纨/缟等
- 文本特征:唐传奇小说集,服饰描写极其丰富
Step 3: 第2轮 grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/玄怪录.txt
结果:无直接命中
```
注意:行140"赐衣服如董慎"含"赐服"语义,但第2轮未直接命中(因"赐衣服"非"赐服"精确匹配)。已在第1轮中捕获。
Step 4: 第3轮 — 按需扩展
bash
rg -n '蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛' /home/z/my-project/upload/part3/玄怪录.txt
| 行号 | 命中关键词 | 初步判定 |
|---|---|---|
| 30 | 桑(桑绠) | ❌ 排除(桑树制绳,非蚕桑) |
| 273 | 蚕、织 | ✅ 不假蚕杼/纟任织 |
Step 5: 排除规则审查
| 规则 | 应用场景 | 结果 |
|---|---|---|
| "丝竹"为音乐代称 | 行5/12/54等 | 已排除 |
| "冠群贤"为动词 | 行108 | 已排除 |
| "桑绠"为绳索 | 行30 | 已排除 |
| "蚕"仅1处为蚕桑义 | 行273 | 保留 |
| "衣冠"合称代指士大夫 | 多处 | 保留——仍含服饰信息 |
排除后有效条目:约35条(24行核心命中)
操作流程轨迹
文件检查✅(473行/122KB) → 读取词库✅ → 第1轮grep✅(117行命中)
→ 第2轮grep✅(0行直接命中) → 第3轮grep✅(2行,1行有效)
→ 排除审查✅(排除丝竹/桑绠等) → 有效命中约35条 → 分类整理✅ → 生成3份文件
统计汇总
| 指标 | 值 |
|---|---|
| 文件大小 | 122,081 字节 / 473 行 |
| 第1轮命中行 | 117 |
| 第2轮命中行 | 0 |
| 第3轮新增命中行 | 1 |
| 排除误命中 | ~80(丝竹/衣冠合称/重复等) |
| 有效命中行 | ~24 |
| 有效服饰条目 | ~35 |
| 服饰类别数 | 8(官服品色/冥府赐服/道士服饰/神仙异服/女子服饰/首饰/丝织品/体服穿着) |