《泾林续记》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《泾林续记》全部服饰相关内容,整理分类 输入:/home/z/my-project/upload/part3/泾林续记.txt(65行,78290字节)
Step 1: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/泾林续记.txt
结果:65 行
wc -c /home/z/my-project/upload/part3/泾林续记.txt
结果:78290 字节
```
文件为中型笔记体古籍,每行极长(类书体),不需分页处理。
Step 2: 第1轮grep — 核心服饰词全搜
bash
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/泾林续记.txt
命中行号:2, 5, 6, 7, 8, 9, 10, 11, 13, 15, 16, 18, 20, 21, 23, 24, 25, 29, 30, 34, 39, 40, 42, 43, 46, 47, 48, 49, 50, 52, 53, 55, 56, 58, 59, 62
命中统计:36行(含大量误命中待排除)
Step 3: 第2轮grep — 制度动作词
bash
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/泾林续记.txt
命中行号:无
结论:本书无直接的赐服/僭越/冠礼等制度关键词,服饰信息完全嵌入叙事。
Step 4: 第3轮grep — 组合扩展词
bash
rg -n '蟒衣|飞鱼服|斗牛服|麒麟服|蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛|乌纱|赐蟒|衣冠|布衣|衣钵|朝衣|蟒袍|赐衣|官服|民服|儒服|僧服|道服|冠服|巾帽|衣带|袍服|裙钗' /home/z/my-project/upload/part3/泾林续记.txt
命中行号:6(麒麟服、冠服), 23(衣箱), 47(冠服、缙绅), 52(冠服)
bash
rg -n '缙绅|绅|纨|绮|绫|缎|纱|褐|毡|靴|履|舄|屦|屐|袄|衫|襦|褂|氅|帻|弁|笏|绶|钏|珮|步摇|花钿|蔽膝|霞帔|缂丝|半臂|裲裆|背子|褙子|比甲|翟衣|袆衣|深衣|裳' /home/z/my-project/upload/part3/泾林续记.txt
命中行号:2(氅), 6(绮、戎装), 9(靴), 23(衫), 24(履), 39(缙绅), 47(缙绅), 56(纱)
Step 5: 误命排除审查
按词库排除规则表逐条审查:
| 排除项 | 行号 | 原文片段 | 排除理由 |
|---|---|---|---|
| 纹石 | 5 | "砌以纹石" | 纹=石材纹理,非织物纹样 |
| 衣包 | 7 | "开衣包中" | 衣包=装衣物的包袱,非穿着描述 |
| 罗帐 | 11 | "几人夫妇同罗帐" | 罗=蚊帐用丝,非衣用 |
| 金饰酒器 | 20 | "封金饰酒器为质" | 饰=器物装饰,非人体佩饰 |
| 履田亩 | 40 | "亲履田亩" | 履=动词行走义 |
| 袖中 | 48 | "出诸袖中" | 袖=衣物部件但语境为取物动作 |
| 更衣 | 53 | "更衣设食" | 更衣=换衣行为,无服饰细节 |
| 黄麻 | 58 | "秋曰黄麻" | 黄麻=瘴气季名,非服饰用麻 |
| 履声 | 62 | "闻门外有履声" | 履声=脚步声,非鞋履实物 |
| 帖服 | 5 | "人皆帖服" | 服=服从义,非服饰 |
Step 6: 有效命中统计
有效命中行号:2, 6, 8, 9, 10, 16, 21, 23, 24, 29, 30, 39, 42, 43, 46, 47, 52, 55, 56, 64
有效命中条数:20条(20行含服饰信息)
命中关键词分类统计: - 首服类:8条(大帽、大冠、峨冠、乌帽、七宝冠、白手巾、巾、冠) - 体服类:22条(鹤氅、绢衣、麒麟服、绛衣、戎装、青衣、蓝布衫、衣裤、法服、重裘、绵衣、夹衣、囚服、纱衣、冠服等) - 腰带类:4条(花金带、冠带×2、缠袋) - 足服类:2条(靴、草履) - 佩饰类:4条(羽扇、金钗、首饰、金环) - 服色制度类:7条(衣绯、衣绿、衣绛、衣青、赐冠带、褫冠服等)
Step 7: sed提取有效命中上下文
对20个有效行号,提取上下文(因笔记体每行极长,sed仅提取命中行本身):
bash
for N in 2 6 8 9 10 16 21 23 24 29 30 39 42 43 46 47 52 55 56 64; do
echo "=== LINE $N ==="
sed -n "${N}p" /home/z/my-project/upload/part3/泾林续记.txt | cut -c1-500
done
因本书为笔记体,每条独立成行,无需跨行提取上下文。
Step 8: 输出文件
| 文件 | 路径 | 说明 |
|---|---|---|
| 总结 | /home/z/my-project/upload/3笔记output/泾林续记/泾林续记_总结.md | 分类整理+对抗式审查 |
| 日志 | /home/z/my-project/upload/3笔记output/泾林续记/泾林续记_日志.md | 本文件 |
| 原文 | /home/z/my-project/upload/3笔记output/泾林续记/泾林续记_原文提取.md | 带行号原文片段 |
操作流程轨迹
读取文件信息(65行/78KB) → 第1轮核心词grep(36行命中)
→ 第2轮制度词grep(0命中) → 第3轮扩展词grep(补充4行)
→ 误命排除审查(排除10项) → 有效命中20行
→ 分类整理(6大类47条) → 对抗式学术审查(6项质询)
→ 生成3份MD文件
关键发现
- 本书为笔记体,服饰信息零散但真实,无专门制度论述
- 最重要发现:麒麟服+花金带的武官赐服组合、褫冠服→囚服→还冠带的制度链
- 品色制度(绯/绿)深入民间想象(冥界故事亦用此色)
- 底层平民完整服饰组合(白手巾+蓝布衫+缠袋+单裤+草履)极为罕见