《玉烛宝典》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《玉烛宝典》全部服饰相关内容,整理分类总结
Step 1: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/玉烛宝典.txt
结果:293行
wc -c /home/z/my-project/upload/part3/玉烛宝典.txt
结果:256679 bytes (约251KB)
```
文件较大(251KB),且为月令类古籍单行极长,遵守"严禁加载整本TXT"规则。
Step 2: 第1轮grep — 核心服饰词全搜
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/玉烛宝典.txt | wc -l
结果:112行命中
```
Step 3: 第2轮grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/玉烛宝典.txt
结果:0行命中
```
Step 4: 第3轮grep — 组合扩展词
```bash rg -n '蟒衣|蟒袍|飞鱼|斗牛|麒麟|赐衣|赐帛|锦衣|玉带|金带|犀带|革带|束帛|绢帛|丝帛|绫罗|锦绣|缂丝|纱帽|乌纱|毡帽|皮弁|进贤冠|红罗|碧绸|织成|纻丝|蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛' /home/z/my-project/upload/part3/玉烛宝典.txt
结果:大量命中
```
关键命中: - Line 38: "冠子" "织布" "命红" — 冠礼、纺织、染色 - Line 52: "三帛" "祭服" "蚕于北郊以为祭服" — 帛礼、祭服、蚕桑 - Line 79: "鞠衣" "青衣青襜青屦" "郊庙之服" — 蚕事服饰 - Line 112: "赤色衣赤采" "织纴" — 孟夏服饰 - Line 177: "锦" "绨" "犊鼻" — 晒衣习俗
Step 5: 排除规则审查
| 关键词 | 误命中数 | 处理 |
|---|---|---|
| 纹 | ~10 | 多为地质/天文描述,排除 |
| 丝 | ~5 | "一丝"为微量义,排除;蚕丝、缫丝保留 |
| 麻 | ~3 | "牡麻"为植物,保留(与纺织相关) |
| 带 | ~3 | "地带"排除 |
| 裘 | 2 | "旗裘毛毳"为冬季皮裘,保留 |
审查后有效服饰条目:约14条。
Step 6: sed提取上下文
bash
sed -n '38,42p' 玉烛宝典.txt # 冠子/织布/命红
sed -n '52,56p' 玉烛宝典.txt # 三帛/祭服/蚕于北郊
sed -n '79,84p' 玉烛宝典.txt # 鞠衣/青衣青襜/蚕事
sed -n '177,180p' 玉烛宝典.txt # 晒衣/锦绨/犊鼻
Step 7: 分类整理与创作
将14条有效条目分为4类: 1. 月令礼仪服饰(8条) 2. 蚕桑纺织制度(3条) 3. 季节性服饰民俗(3条) 4. 衣料与物产(2条)
创作三份MD: - 玉烛宝典_总结.md - 玉烛宝典_日志.md(本文件) - 玉烛宝典_原文提取.md
操作流程轨迹
文件扫描293行/251KB → 第1轮grep 112行命中
→ 第2轮grep 0行命中 → 第3轮grep 大量命中
→ 排除规则审查过滤 → 有效条目约14条
→ sed提取上下文 → 四类分类整理 → 创作三份MD
审核结果
- 原文验证:✅ grep行号对应
- 排除规则:✅ 天文/地质"纹"已排除;"地带"已排除
- 体积检查:✅ 三篇MD均<20KB