《王文正笔录》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《王文正笔录》全部服饰相关内容,整理分类总结
Step 0: 文件基本信息
```bash wc -l -c /home/z/my-project/upload/part3/王文正笔录.txt
结果:57行 / 16893字节
文本性质:宋·王曾撰,记太祖太宗真宗三朝旧闻,笔记体
```
Step 1: 读取关键词词库
```bash
词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md
已读取
```
Step 2: 第1轮 grep — 核心服饰词
bash
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/王文正笔录.txt
第1轮命中统计
| 行号 | 命中关键词 | 初步判定 |
|---|---|---|
| 18 | 服带、冠(冠首) | ✅/❌ |
| 20 | 非服饰义 | ❌ 排除 |
| 21 | 衣冠(汉衣冠)、履(行履) | ✅/❌ |
| 24 | 帛(金帛) | ✅ |
| 25 | 帛(玉帛) | ✅ |
| 28 | 朝服/公服/时服/单衣/夹公服 | ✅✅✅✅✅ 核心条目 |
| 33 | 衣(布衣) | ✅ |
| 34 | 帛(金帛) | ✅ |
| 36 | 冠(冠于当时) | ❌ 排除 |
| 37 | 衣(布衣) | ✅ |
| 38 | 裾(敛裾) | ✅ |
| 42 | 燕服/袍/带(袍带) | ✅✅✅ |
Step 3: 第2轮 grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/王文正笔录.txt
结果:无命中
```
Step 4: 第3轮 — 按需扩展
```bash rg -n '时服|衣冠|单衣|夹衣|金帛|玉帛|布衣|袍带|裾' /home/z/my-project/upload/part3/王文正笔录.txt
确认:行21/24/25/28/33/34/37/38/42 均含有效服饰内容
```
Step 5: 排除规则审查
| 规则 | 应用场景 | 结果 |
|---|---|---|
| "冠"在"冠军/冠绝"语境中排除 | 行18"冠首"、行36"冠于当时" | 已排除(首位义,非首服) |
| "履"在"行履"中排除 | 行21"行履才干" | 已排除(品行义,非鞋履) |
| "帛"视语境保留 | 行24/25/34金帛/玉帛 | 保留(丝帛制度) |
| "布衣"代指平民保留 | 行33/37 | 保留(仍含服饰信息) |
排除后有效命中:7行,10处服饰条目
操作流程轨迹
文件检查✅(57行/17KB) → 读取词库✅ → 第1轮grep✅(12行命中)
→ 第2轮grep✅(0行命中) → 第3轮grep✅(补充确认)
→ 排除审查✅(排除3项) → 有效命中10条 → sed上下文提取✅
→ 分类整理✅(5类) → 生成3份文件
统计汇总
| 指标 | 值 |
|---|---|
| 文件大小 | 16,893 字节 / 57 行 |
| 第1轮命中行 | 12 |
| 第2轮命中行 | 0 |
| 第3轮确认行 | 9 |
| 排除误命中 | 3 |
| 有效命中行 | 7 |
| 有效服饰条目 | 10 |
| 服饰类别数 | 5(官服制度/赐服外交/衣料丝帛/布衣/礼仪行为) |