《湘山野录》服饰内容提取 — 操作日志

日期:2026-04-19 任务:提取《湘山野录》全部服饰相关内容,整理分类总结 输入文件:/home/z/my-project/upload/part3/湘山野录.txt 文件规模:238行 / 101KB


Step 1: 文件基本信息

bash wc -l 湘山野录.txt # 238行 ls -lh 湘山野录.txt # 101KB


Step 2: 读取词库

词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md 已完整读取,按三轮grep策略执行。


Step 3: 第1轮grep — 核心服饰词

```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 湘山野录.txt | wc -l

结果:90行命中

```

高歧义关键词统计:

关键词 命中行数 服饰相关(估) 非服饰(估)
~20 ~8 ~12
~8 ~3 ~5
~6 ~3 ~3
~3 ~1 ~2
~10 ~3 ~7
~5 0 ~5
~5 0 ~5
~3 ~1 ~2

Step 4: 第2轮grep — 制度动作词

```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 湘山野录.txt | wc -l

结果:1行命中

```


Step 5: 第3轮grep — 组合扩展词

```bash rg -n '青衿|短褐|野服|束帛|锦衣|紫绶|象简|绿衣|银带|玉带|缣|纻丝|赗禭|襚|衰绖|衮冕|赐衣|朝服|幅巾|紫褐|羽氅|缃|织金|缣' 湘山野录.txt | wc -l

结果:约18行命中

```


Step 6: 排除审查

关键词 误命类型 排除操作
动词/方位义(带领、地带、带往) 排除~5行,保留3行(银带、袍带、腰带)
"新佩玉麒麟"佩戴义 保留1行
环绕等非首饰义 全部排除
人名 全部排除
服从、服丧等非服饰义 排除~7行,保留3行
锦州等地名、修辞 排除~3行,保留4行

排除后有效命中:约19行(含13条高质量/中等质量服饰条目)


Step 7: sed上下文提取

对13条核心命中行号,提取上下文片段。因行数密集,主要提取L12、L16、L29、L64、L101、L106、L109、L140、L148、L153、L180、L188、L189的上下文。


Step 8: 分类整理

将13条有效命中分为7类: 1. 赐服与赏赐(3条) 2. 冠服名目与礼仪(3条) 3. 人物服饰品评(6条) 4. 钱镠衣锦还乡(1条) 5. 出家服饰(3条) 6. 丧服与赗赠(2条) 7. 服制议论(1条)


Step 9: 生成三份文件

文件 路径 说明
总结 /home/z/my-project/upload/3笔记output/湘山野录/湘山野录_总结.md 含对抗式审查
日志 /home/z/my-project/upload/3笔记output/湘山野录/湘山野录_日志.md 含grep命令和统计
原文 /home/z/my-project/upload/3笔记output/湘山野录/湘山野录_原文提取.md 带行号片段

操作流程轨迹

文件基本信息确认✅(238行/101KB) → 读取词库✅ → 第1轮grep核心词90行命中 → 第2轮grep制度词1行命中(排除) → 第3轮grep组合扩展~18行命中 → 排除审查(~71行排除,~19行有效) → 分类整理7类13条 → 生成3份MD文件

统计摘要

指标 数值
文件总行数 238
第1轮原始命中行 90
第2轮原始命中行 1
第3轮扩展命中行 ~18
排除后有效行 ~19
高/中质量服饰条目 13
分类数 7