《涑水记闻》服饰内容提取 — 操作日志
日期:2026-03-04 任务:提取《涑水记闻》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/涑水记闻.txt
结果:603行
wc -c /home/z/my-project/upload/part3/涑水记闻.txt
结果:288930 bytes (约289KB)
```
中等文件,遵守"严禁加载整本TXT"规则,全程使用grep+sed操作。
Step 2: 第1轮grep — 核心服饰词全搜
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/涑水记闻.txt | wc -l
结果:139行命中
```
Step 3: 第2轮grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/涑水记闻.txt | wc -l
结果:14行命中
```
Step 4: 第3轮grep — 组合扩展词
```bash rg -n '赐紫|赐绯|袭衣|金带|银带|犀带|章服|紫袍|绯袍|赐衣|赐帛|纱帽|幞头|笏|绶|紫衣|红罗|束带' /home/z/my-project/upload/part3/涑水记闻.txt
结果:提取到约20条高价值条目
```
Step 5: 排除规则审查
逐条审查139+14条命中,按排除规则表过滤:
| 关键词 | 误命中数 | 处理 |
|---|---|---|
| 带 | ~20条 | "带领""地带"排除,"金带""银带""束带"保留 |
| 服 | ~15条 | "服从""服丧""服阕""服用"排除,"章服""赐服"保留 |
| 罗一人名 | ~3条 | "唃斯罗"人名,排除 |
| 锦 | ~2条 | "锦衣"此书中无锦衣卫用法,保留 |
| 紫 | ~3条 | "紫宸殿"为殿名排除,"赐紫""紫衣"保留 |
| 麻 | ~2条 | 无麻制义,保留 |
| 丝 | ~5条 | "丝绢"保留,"丝毫无"排除 |
审查后有效服饰条目约21条。
Step 6: sed提取上下文
对关键行号提取上下文:
bash
sed -n '41,47p' 涑水记闻.txt # 黄袍加身
sed -n '63,66p' 涑水记闻.txt # 赐袭衣金带
sed -n '135,139p' 涑水记闻.txt # 赐绯文犀带
sed -n '142,146p' 涑水记闻.txt # 幞头坠地
sed -n '152,156p' 涑水记闻.txt # 束带
sed -n '165,169p' 涑水记闻.txt # 赐绯章服
sed -n '174,179p' 涑水记闻.txt # 赐紫章服/金带犀带
sed -n '197,201p' 涑水记闻.txt # 赐紫赐绯
sed -n '358,363p' 涑水记闻.txt # 花幞头/褐袍
sed -n '367,371p' 涑水记闻.txt # 幞头工人
sed -n '453,457p' 涑水记闻.txt # 赐紫衣
Step 7: 分类整理与创作
将21条有效条目分为5类: 1. 黄袍与建国服饰(3条) 2. 赐服制度(8条) 3. 腰带等级(2条) 4. 幞头(3条) 5. 其他服饰(5条)
创作三份MD完成。
操作流程轨迹
文件扫描603行/289KB → 第1轮grep 139行命中
→ 第2轮grep 14行命中 → 第3轮组合扩展
→ 排除规则审查过滤 → 有效条目约21条
→ sed提取上下文 → 五类分类整理 → 创作三份MD
审核结果
- 原文验证:✅ grep行号对应
- 排除规则:✅ "带领""紫宸殿""服从"等误命中已排除
- 体积检查:✅ 三篇MD均<20KB