《王郭两先生崇论》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《王郭两先生崇论》全部服饰相关内容,整理分类总结
Step 0: 文件基本信息
```bash wc -l -c /home/z/my-project/upload/part3/王郭两先生崇论.txt
结果:1898行 / 429020字节
文本性质:明末清初·王与郭两先生崇论集,大型论辩文
注意:>500KB限制,严禁一次性载入,使用grep定位+sed提取
```
Step 1: 读取关键词词库
已读取。
Step 2: 第1轮 grep — 核心服饰词
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/王郭两先生崇论.txt
结果:166行命中
```
第1轮命中统计(筛选关键行)
| 行号 | 命中关键词 | 初步判定 |
|---|---|---|
| 107 | 弁(弁髦) | ✅ |
| 236 | 服色(易服色) | ✅ |
| 455 | 冕/黻/弁/衫 | ✅✅✅✅ 核心条目 |
| 475 | 服(斩衰/释服) | ✅ |
| 484 | 绅(搢绅) | ✅ |
| 689 | 绅(缙绅) | ✅ |
| 1019 | 绅/笏/弁/甲 | ✅✅✅✅ |
| 1056 | 黻/冕/衣 | ✅✅✅ |
| 1091 | 服(服餙) | ✅ |
| 1175 | 丝/服/带/祭服/朝服/衣 | ✅✅✅✅✅✅ 核心条目 |
| 1324 | 冠服 | ✅✅ |
| 1334 | 服(释服) | ✅ |
| 1429 | 服色(易服色) | ✅ |
| 1505 | 衮衣 | ✅ |
| 1515 | 冕(周冕) | ✅ |
| 其余约150行 | 多为非服饰义命中 | ❌ 排除 |
Step 3: 第2轮 grep — 制度动作词
bash
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/王郭两先生崇论.txt
命中:行72(僭)、行167(僭)、行281(僭)、行475(释服)、行549(僭窃)、行559(僭)、行1334(释服)
有效新增: - 行475: 释服(丧服制度)✅ - 行1334: 释服 ✅
Step 4: 第3轮 — 按需扩展
```bash rg -n '弁衫|冕黻|冠服|黻冕|搢绅|缙绅|垂绅|蚕|桑|茧|织' /home/z/my-project/upload/part3/王郭两先生崇论.txt
确认核心条目
```
Step 5: 排除规则审查
| 规则 | 应用场景 | 结果 |
|---|---|---|
| "绅"在搢绅/缙绅中保留 | 行484/689 | 保留(绅=大带)✅ |
| "弁"在弁髦中保留 | 行107/1019 | 保留(弁=首服)✅ |
| 大量非服饰义命中排除 | 约150行 | 排除(衣作"衣钵"、冠作"冠军"、服作"服从"等) |
排除后有效命中:约14条
操作流程轨迹
文件检查✅(1898行/429KB) → 读取词库✅ → 第1轮grep✅(166行命中)
→ 第2轮grep✅(7行命中) → 第3轮grep✅(补充确认)
→ 排除审查✅(排除~150项) → 有效命中14条 → sed上下文提取✅
→ 分类整理✅(7类) → 生成3份文件
统计汇总
| 指标 | 值 |
|---|---|
| 文件大小 | 429,020 字节 / 1898 行 |
| 第1轮命中行 | 166 |
| 第2轮命中行 | 7 |
| 第3轮确认行 | 10 |
| 排除误命中 | ~152 |
| 有效命中行 | 14 |
| 有效服饰条目 | 14 |
| 服饰类别数 | 7(冕服/服色/丧服/蚕桑/冠服代称/禁令/衣料铠甲) |