- 《汉武帝内传》服饰内容提取 — 操作日志
- 结果:65行 / 50158字节
- 文本性质:六朝道教志怪小说(旧题汉·班固撰)
- 每行极长(平均772字/行),属"单行长文"类型
- 词库包含:
- - 核心服饰词(首服/体服/下服/足服/腰带/佩饰/礼服/衣料/染色纹样)
- - 制度动作词(赐予/禁令/等级/礼仪/日常)
- - 组合扩展词(品色/补服/鱼袋/冕服/幞头/赐服/蚕桑/经济)
- - 排除规则表(衣/麻/罗/环/领/带/佩/服/冠/帽/褐/巾/帛/锦/裳)
- 命中行:4, 5, 6, 7, 11, 12, 13, 14, 16, 17, 20, 22, 24, 31, 37, 38, 39, 42, 52, 53, 54
- 总命中行数:21行
- 结果:无命中
《汉武帝内传》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《汉武帝内传》全部服饰相关内容,整理分类总结
Step 0: 文件基本信息
```bash wc -l -c /home/z/my-project/upload/part3/汉武帝内传.txt
结果:65行 / 50158字节
文本性质:六朝道教志怪小说(旧题汉·班固撰)
每行极长(平均772字/行),属"单行长文"类型
```
Step 1: 读取关键词词库
```bash cat /home/z/my-project/skills/rysxguji/references/fushi-keywords.md
词库包含:
- 核心服饰词(首服/体服/下服/足服/腰带/佩饰/礼服/衣料/染色纹样)
- 制度动作词(赐予/禁令/等级/礼仪/日常)
- 组合扩展词(品色/补服/鱼袋/冕服/幞头/赐服/蚕桑/经济)
- 排除规则表(衣/麻/罗/环/领/带/佩/服/冠/帽/褐/巾/帛/锦/裳)
```
Step 2: 第1轮 grep — 核心服饰词
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|钗|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' "/home/z/my-project/upload/part3/汉武帝内传.txt"
命中行:4, 5, 6, 7, 11, 12, 13, 14, 16, 17, 20, 22, 24, 31, 37, 38, 39, 42, 52, 53, 54
总命中行数:21行
```
第1轮命中统计
| 行号 | 命中关键词 | 初步判定 |
|---|---|---|
| 4 | 衣(着青衣) | ✅ 服饰 |
| 5 | 锦(云锦之帐)、服(盛服) | ✅ 服饰 |
| 6 | 褂(青绫之褂)、锦(黄锦)、绶(灵飞大绶)、冠(天真之冠/太真晨婴之冠)、舄(凤文之舄)、佩(佩金刚灵玺)、履(履元琼) | ✅ 服饰 |
| 7 | 服(所服=服用) | ❌ 排除 |
| 11 | 服(所服=服用) | ❌ 排除 |
| 12 | 带(束带) | ✅ 服饰动作 |
| 13 | 衣(青衣)、袍(赤霜之袍)、绣(非绣) | ✅ 服饰 |
| 14 | 冠(九灵夜光之冠)、佩(火玉之佩)、绶(琳华之绶) | ✅ 服饰 |
| 16 | 巾(巾笈=书箱) | ❌ 排除 |
| 17 | 锦(紫锦之囊)、佩(所宜佩) | ✅ 丝帛器物 |
| 20 | 审查后无明确服饰内容 | ❌ 排除 |
| 22 | 审查后无明确服饰内容 | ❌ 排除 |
| 24 | 审查后无明确服饰内容 | ❌ 排除 |
| 31 | 纹(斑纹之符=符箓纹) | ❌ 排除 |
| 37 | 佩(佩我六遁/佩此六辛/佩我六巳) | ⚠️ 仪式佩饰,保留 |
| 38 | 帛(兰简之帛)、素(北?之素) | ✅ 丝帛 |
| 39 | 锦(云锦之囊) | ✅ 丝帛器物 |
| 42 | 盖(云盖=车盖) | ❌ 排除 |
| 52 | 冠、带(冠带执佩物名) | ✅ 服饰体系 |
| 53 | 锦(紫锦为帏囊)、衣(整衣服) | ✅ 服饰 |
| 54 | 帛(人帛一匹) | ✅ 丝帛 |
Step 3: 第2轮 grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' "/home/z/my-project/upload/part3/汉武帝内传.txt"
结果:无命中
```
Step 4: 第3轮 — 按需扩展
因第1轮有效命中已达13行,且文本仅65行,内容已充分覆盖,无需扩展搜索。
Step 5: 排除规则审查
| 规则 | 应用场景 | 结果 |
|---|---|---|
| "服"在"所服"语境中排除 | 行7、11 | 已排除("服用/食用"义,非服饰) |
| "巾"在"巾笈"语境中排除 | 行16 | 已排除("书箱"义,非头巾) |
| "纹"在"斑纹之符"语境中排除 | 行31 | 已排除("符箓纹"非"服饰纹样") |
| "盖"在"云盖"语境中排除 | 行42 | 已排除("车盖/天象"非"冠盖") |
排除后有效命中行:4, 5, 6, 12, 13, 14, 17, 37, 38, 39, 52, 53, 54(共13行)
操作流程轨迹
文件检查✅(65行/50KB) → 读取词库✅ → 第1轮grep✅(21行命中)
→ 第2轮grep✅(0行命中) → 第3轮(跳过) → 排除审查✅(排除8行)
→ 有效命中13行 → sed上下文提取✅ → 分类整理✅ → 生成3份文件
统计汇总
| 指标 | 值 |
|---|---|
| 文件大小 | 50,158 字节 / 65 行 |
| 第1轮命中行 | 21 |
| 第2轮命中行 | 0 |
| 排除误命中 | 8 |
| 有效命中行 | 13 |
| 有效服饰条目 | 25 |
| 服饰类别数 | 8(仙真体服/首服/足服/佩饰/侍女服饰/武帝服饰/丝帛器物/帛的赏赐) |