《独异志》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《独异志》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/part3/独异志.txt(454行,97819字节)
Step 1: 文件信息确认
```bash wc -l -c /home/z/my-project/upload/part3/独异志.txt
结果:454行,97819字节
```
Step 2: 第1轮grep — 核心服饰词全搜
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 独异志.txt
结果:约80行命中(含大量误命中需审查)
```
Step 3: 误命中审查与排除
逐条审查后排除: - 行9:"织女" → 星名/神话人物,非纺织服饰 → 排除 - 行14:"刘裔" → "裔"非服饰 → 排除 - 行87:"瘤" → 疾病,非服饰 → 排除 - 行119:"角马木长钉" → 非服饰 → 排除 - 行177:缚鸢飞空 → 非服饰 → 排除 - 行186:伐查 → 非服饰 → 排除 - 行207:隐几化为鹿 → "几"非服饰 → 排除 - 行214:"罗者所获" → "罗"为捕网,非丝织品 → 排除 - 行248:拢马 → 非服饰 → 排除 - 行306:四皓 → 非直接服饰 → 排除 - 行318:飞鸢衔腐鼠 → 非服饰 → 排除 - Line 339:"免冠跣足" → 冠为首服 → 保留 - 行354:"不履城郭" → "履"为动词 → 排除 - 行377:"对妆台" → 非直接服饰 → 排除 - 行387:传达用妇人 → 非服饰 → 排除 - 行390:"不履地" → "履"为动词 → 排除 - 行417:"不履人事" → "履"为动词 → 排除 - 行434:"抽其巾缢之" → 巾用于缢杀非服饰 → 排除
Step 4: 第2轮grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 独异志.txt
结果:1行命中
行446:"初释服,往见会昌寺克慎师" — 释服=丧满除服 → 保留
```
Step 5: 第3轮grep — 组合扩展词
```bash rg -n '蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛' 独异志.txt
结果:
行9:织女 → 星名 → 排除
行39:桑皮细针缝合 → 医疗用 → 排除
行134:织鸟兽之形 → 服饰纺织 → 保留
行256:蚕茧纸 → 文房用 → 排除
行261:焚机而出 → 纺织制度 → 保留
行290:桑妇 → 非服饰 → 排除
行324:织锦为回文诗 → 织锦 → 保留
行413:织女侍儿 → 神话 → 排除
行427:桑树 → 非服饰 → 排除
```
Step 6: sed 上下文提取
对有效命中行号执行 sed 提取上下文(N-2至N+5行),提取30个有效片段。
Step 7: 分类与输出
按8类整理:朝堂品阶/日常生活/丧葬礼制/衣料纺织/首服佩饰/戎服/足服/文学意象
有效服饰命中:约25条(中等丰富度)
操作流程轨迹
文件确认(454行/98KB) → 第1轮核心词grep(~80行命中) → 误命中审查排除(~55条排除)
→ 第2轮制度词grep(1行命中) → 第3轮扩展词grep(3条有效)
→ sed上下文提取(30个片段) → 分类归纳(8类25条) → 三MD输出
审核结果
- 原文验证:✅ grep 行号对应
- 误命排除:✅ 已逐条审查排除
- 分类合理:✅ 符合志怪笔记体实际分布