《汉武故事》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《汉武故事》全部服饰相关内容,整理分类总结 输入文件:/home/z/my-project/upload/part3/汉武故事.txt


Step 0: 文件基本信息

```bash wc -l -c /home/z/my-project/upload/part3/汉武故事.txt

结果:56行 / 23,858字节

```


Step 1: 第1轮grep — 核心服饰词

bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|钗|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' "/home/z/my-project/upload/part3/汉武故事.txt"

结果:命中14行

行号 命中关键词 原文片段
L6 衣、服 轻服为微行 / 衣如凡庶
L10 起更衣 / 侍衣
L14 带剑群聚
L19 衣服 衣服不整
L24 衣冠 葬其衣冠 / 葬吾衣冠
L27 羽衣(×2)
L32 衣冠 衣冠具足
L34 胜、履、纹、舄 七胜履玄琼凤文之舄
L38 服、衣 器服 / 侍衣(×2)
L44 衣履、披 唯衣履存焉 / 上自披
L45 带剑入
L50 卤簿 卤簿似天子仪卫
L55 御衣 / 冬衣 / 庙衣

统计:核心词命中行=14行,去重后涉及行=10行


Step 2: 第2轮grep — 制度动作词

bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' "/home/z/my-project/upload/part3/汉武故事.txt"

结果:0条命中

本书无制度动作词命中,符合预期——志怪小说不以制度叙事为主。


Step 3: 第3轮grep — 按需扩展词

鉴于前两轮命中较少(仅14行),按词库规定执行第3轮扩展搜索:

bash rg -n '蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛|紫衣|金带|玉带|绣衣|锦衣|纱帽|角带|大裘|衮冕|赐衣|赐帛|锦彩|锦罽' "/home/z/my-project/upload/part3/汉武故事.txt"

结果:1条命中

行号 命中关键词 原文片段
L29 有老母采桑

"采桑"为东方朔母亲采桑之叙事,属蚕桑纺织背景,但无具体服饰信息,记为间接参考。


Step 4: 排除误命中

按排除规则表逐条审查:

行号 原文 命中词 排除理由 判定
L14 "何忽带剑群聚" 带=动词"携带",非腰带 ✅排除
L44 "上自披,手即申" 披=拨开(拳头),非服饰动词 ✅排除
L45 "带剑入中龙华门" 带=动词"携带",非腰带 ✅排除

排除3条,剩余有效命中=12条


Step 5: sed上下文提取

对12条有效命中,逐条提取上下文(N-2至N+5行):

bash sed -n '4,8p' /home/z/my-project/upload/part3/汉武故事.txt # L6上下文 sed -n '8,12p' /home/z/my-project/upload/part3/汉武故事.txt # L10上下文 sed -n '17,21p' /home/z/my-project/upload/part3/汉武故事.txt # L19上下文 sed -n '22,26p' /home/z/my-project/upload/part3/汉武故事.txt # L24上下文 sed -n '25,29p' /home/z/my-project/upload/part3/汉武故事.txt # L27上下文 sed -n '30,34p' /home/z/my-project/upload/part3/汉武故事.txt # L32上下文 sed -n '32,40p' /home/z/my-project/upload/part3/汉武故事.txt # L34上下文 sed -n '36,43p' /home/z/my-project/upload/part3/汉武故事.txt # L38上下文 sed -n '42,48p' /home/z/my-project/upload/part3/汉武故事.txt # L44上下文 sed -n '48,56p' /home/z/my-project/upload/part3/汉武故事.txt # L50,L55上下文

全部上下文已提取,用于后续分类整理。


Step 6: 分类整理与输出

将12条有效命中按内容归为9类: 1. 皇帝微行便服(L6) 2. 后宫服饰职官(L10, L38) 3. 官员服饰(L19,间接) 4. 衣冠葬俗(L24) 5. 方士服饰(L27) 6. 神仙服饰(L32, L34) 7. 异域器服(L38,笼统) 8. 服饰遗存(L44) 9. 仪仗制度(L50) 10. 御衣灵异(L55)

输出三份文件: - 汉武故事_总结.md — 结构化总结+对抗式审查 - 汉武故事_日志.md — 本文件 - 汉武故事_原文提取.md — 带行号的原文片段


统计摘要

项目 数量
全文行数 56
第1轮命中行 14
第2轮命中行 0
第3轮命中行 1
排除误命中 3
有效命中条目 12
分类数 9

操作流程轨迹

读取文件信息✅(56行/24KB) → 第1轮grep✅(14行命中) → 第2轮grep✅(0行命中) → 第3轮grep✅(1行命中) → 排除审查✅(排除3条) → sed上下文提取✅(10次) → 分类整理✅(9类12条) → 输出3份MD✅

关键发现