《湛园札记》服饰内容提取 — 操作日志

日期:2026-04-19 任务:提取《湛园札记》全部服饰相关内容 输入文件:/home/z/my-project/upload/part3/湛园札记.txt 文件规模:488行 / 129KB


Step 1: 文件基本信息

bash wc -l 湛园札记.txt # 488行 ls -lh 湛园札记.txt # 129KB


Step 2: 读取词库

词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md 已完整读取。


Step 3: 第1轮grep — 核心服饰词

```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|……' 湛园札记.txt | wc -l

结果:88行命中

```


Step 4: 第2轮grep — 制度动作词

```bash rg -n '赐服|赐紫|赐绯|……|僭|……|冠礼|笄礼|释服|加冠' 湛园札记.txt | wc -l

结果:4行命中

```


Step 5: 第3轮grep — 组合扩展词

```bash rg -n '朝服|公服|冠服|衮冕|舆服|赐服|常服|祭服|法服|深衣|蟒衣|鱼袋|幞头|霞帔|裲裆|蔽膝|弁|胄|缨|花钿|蹀躞|缂丝|黼|黻|翟衣|袆衣|赐紫|赐绯|玉带|金带|犀带|鞓带|革带|赐衣|赐帛|束帛|锦衣|紫袍|绯袍|朝服|幅巾|野服|短褐|丧服|缞|墨缞|赗禭|襚|卤簿' 湛园札记.txt | wc -l

结果:约64行命中

```


Step 6: 排除审查

关键词 误命类型 排除操作
服从、服丧、服药 排除~10行,保留3行
冠军等 排除~3行,保留3行
地带、带领 排除~5行,保留1行
锦州 排除~2行,保留0行
政治僭越 排除2行,保留0行

排除后有效命中:约20行(含16条高质量/中等质量服饰条目)


Step 7: 分类整理

将16条有效命中分为4类: 1. 礼制考证(5条) 2. 冠服制度(5条) 3. 历史服饰品评(3条) 4. 制度词语考证(3条)


Step 8: 生成三份文件

文件 路径
总结 /home/z/my-project/upload/3笔记output/湛园札记/湛园札记_总结.md
日志 /home/z/my-project/upload/3笔记output/湛园札记/湛园札记_日志.md
原文 /home/z/my-project/upload/3笔记output/湛园札记/湛园札记_原文提取.md

操作流程轨迹

文件基本信息确认✅(488行/129KB) → 读取词库✅ → 第1轮grep核心词88行命中 → 第2轮grep制度词4行命中(2行保留) → 第3轮grep组合扩展~64行命中 → 排除审查(~68行排除,~20行有效) → 分类整理4类16条 → 生成3份MD文件

统计摘要

指标 数值
文件总行数 488
第1轮原始命中行 88
第2轮原始命中行 4
第3轮扩展命中行 ~64
排除后有效行 ~20
高/中质量服饰条目 16
分类数 4