《涧泉日记》服饰内容提取 — 操作日志
日期:2026-03-04 任务:提取《涧泉日记》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/涧泉日记.txt
结果:225行
wc -c /home/z/my-project/upload/part3/涧泉日记.txt
结果:54738 bytes (约55KB)
```
小文件,仍遵守"严禁加载整本TXT"规则,全程使用grep+sed操作。
Step 2: 第1轮grep — 核心服饰词全搜
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/涧泉日记.txt | wc -l
结果:37行命中
```
Step 3: 第2轮grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/涧泉日记.txt | wc -l
结果:0行命中
```
Step 4: 排除规则审查
37条命中逐条审查:
| 关键词 | 误命中 | 处理 |
|---|---|---|
| 衣 | "解衣裹之"(行51) | 排除——裹骨非服饰穿着 |
| 衣 | "清贫衣服窭甚"(行105) | 保留——描述衣着状况 |
| 衣 | "身衣弋绡"(行69) | 保留——服饰节俭典故 |
| 冠 | "虽冠不命不敢坐"(行131) | 保留——冠礼成年义 |
| 冠 | "章甫字冠之"(行112) | 排除——人名字号 |
| 罗 | "婺州贡罗"(行52) | 保留——丝织品 |
| 带 | "毁裂冠带"(行77) | 保留——官服腰带 |
| 绢 | "折纳绢"(行54) | 保留——丝绢赋税 |
| 丝 | "丝毫无"类 | 排除——非丝织品义 |
| 纹 | "纹理"类 | 排除——非纹样义 |
审查后有效条目8条。
Step 5: sed提取上下文
bash
sed -n '36,40p' 涧泉日记.txt # 太后袆衣衮衣
sed -n '62,66p' 涧泉日记.txt # 朝服端笏
sed -n '67,71p' 涧泉日记.txt # 身衣弋绡
sed -n '75,79p' 涧泉日记.txt # 毁裂冠带
sed -n '94,98p' 涧泉日记.txt # 章服
sed -n '108,112p' 涧泉日记.txt # 布衣皮冠
sed -n '50,54p' 涧泉日记.txt # 贡罗/和买绢
Step 6: 分类整理
8条有效条目分为5类: 1. 宫廷礼服(1条,价值最高) 2. 朝服与品级(2条) 3. 服饰与身份转变(2条) 4. 服饰节俭典故(1条) 5. 丝绢经济(2条)
操作流程轨迹
文件扫描225行/55KB → 第1轮grep 37行命中
→ 第2轮grep 0行命中(无制度动作词命中)
→ 排除规则审查 → 有效条目8条
→ sed提取上下文 → 五类分类整理 → 创作三份MD
审核结果
- 原文验证:✅ grep行号对应
- 排除规则:✅ "解衣裹之""章甫字冠之"等已排除
- 体积检查:✅ 三篇MD均<20KB
- 内容级别:稀少(8条),已如实标注