《湛园札记》服饰内容提取 — 操作日志
日期:2026-04-19 任务:提取《湛园札记》全部服饰相关内容 输入文件:/home/z/my-project/upload/part3/湛园札记.txt 文件规模:488行 / 129KB
Step 1: 文件基本信息
bash
wc -l 湛园札记.txt # 488行
ls -lh 湛园札记.txt # 129KB
Step 2: 读取词库
词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md 已完整读取。
Step 3: 第1轮grep — 核心服饰词
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|……' 湛园札记.txt | wc -l
结果:88行命中
```
Step 4: 第2轮grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|……|僭|……|冠礼|笄礼|释服|加冠' 湛园札记.txt | wc -l
结果:4行命中
```
- L110: 僭晋(政治僭越)→ 排除
- L227: 冠字/冠礼 → 保留
- L229: 冠礼 → 保留
- L314: 僭王(政治僭越)→ 排除
Step 5: 第3轮grep — 组合扩展词
```bash rg -n '朝服|公服|冠服|衮冕|舆服|赐服|常服|祭服|法服|深衣|蟒衣|鱼袋|幞头|霞帔|裲裆|蔽膝|弁|胄|缨|花钿|蹀躞|缂丝|黼|黻|翟衣|袆衣|赐紫|赐绯|玉带|金带|犀带|鞓带|革带|赐衣|赐帛|束帛|锦衣|紫袍|绯袍|朝服|幅巾|野服|短褐|丧服|缞|墨缞|赗禭|襚|卤簿' 湛园札记.txt | wc -l
结果:约64行命中
```
Step 6: 排除审查
| 关键词 | 误命类型 | 排除操作 |
|---|---|---|
| 服 | 服从、服丧、服药 | 排除~10行,保留3行 |
| 冠 | 冠军等 | 排除~3行,保留3行 |
| 带 | 地带、带领 | 排除~5行,保留1行 |
| 锦 | 锦州 | 排除~2行,保留0行 |
| 僭 | 政治僭越 | 排除2行,保留0行 |
排除后有效命中:约20行(含16条高质量/中等质量服饰条目)
Step 7: 分类整理
将16条有效命中分为4类: 1. 礼制考证(5条) 2. 冠服制度(5条) 3. 历史服饰品评(3条) 4. 制度词语考证(3条)
Step 8: 生成三份文件
| 文件 | 路径 |
|---|---|
| 总结 | /home/z/my-project/upload/3笔记output/湛园札记/湛园札记_总结.md |
| 日志 | /home/z/my-project/upload/3笔记output/湛园札记/湛园札记_日志.md |
| 原文 | /home/z/my-project/upload/3笔记output/湛园札记/湛园札记_原文提取.md |
操作流程轨迹
文件基本信息确认✅(488行/129KB)
→ 读取词库✅
→ 第1轮grep核心词88行命中
→ 第2轮grep制度词4行命中(2行保留)
→ 第3轮grep组合扩展~64行命中
→ 排除审查(~68行排除,~20行有效)
→ 分类整理4类16条
→ 生成3份MD文件
统计摘要
| 指标 | 数值 |
|---|---|
| 文件总行数 | 488 |
| 第1轮原始命中行 | 88 |
| 第2轮原始命中行 | 4 |
| 第3轮扩展命中行 | ~64 |
| 排除后有效行 | ~20 |
| 高/中质量服饰条目 | 16 |
| 分类数 | 4 |