《玉堂丛语》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《玉堂丛语》全部服饰相关内容,整理分类总结


Step 0: 文件基本信息

```bash wc -l -c /home/z/my-project/upload/part3/玉堂丛语.txt

结果:1024行 / 383867字节

文本性质:明·焦竑撰笔记(翰林院掌故)

```


Step 1: 读取关键词词库

```bash

词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md

```


Step 2: 第1轮 grep — 核心服饰词

bash rg -n '冠|冕|袍|裘|帻|幞头|裙|衫|褐|缙|绅|绫|罗|锦|绣|帛|绢|绸|缎|朝服|公服|常服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|笏|绶|靴|霞帔|簪|钗|鱼袋|服色|章服|品服|丧服|祭服|戎服|缂丝' /home/z/my-project/upload/part3/玉堂丛语.txt

第1轮命中统计


Step 3: 第2轮 grep — 制度动作词

bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/玉堂丛语.txt

行号 命中关键词 初步判定
374 冠礼 ✅ 太子冠礼
462 僭(僭尘上听) ❌ 排除(僭为僭越义,非服饰僭制语境)

Step 4: 第3轮 — 按需扩展

bash rg -n '蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛' /home/z/my-project/upload/part3/玉堂丛语.txt

行号 命中关键词 初步判定
89 织(家应织) ❌ 排除(织役,非服饰)
117 桑(课农桑) ❌ 排除(农政,非蚕桑)
182 织(缉纺绵纱织布) ✅ 纺织与布匹纳税
274 锦(天机锦) ✅ 与第1轮重合
382 市舶 ❌ 排除(非服饰语境)
401 市舶 ❌ 排除(非服饰语境)
417 织(织造) ✅ 明代织造制度
543 织(织布添花) ✅ 织造与服饰
820 桑(桑枣榆柳) ❌ 排除(树木,非蚕桑)
821 桑(农桑辑要) ❌ 排除(农书名)
927 帕首裤靴 ✅ 首服+体服+足服组合
1007 罗织 ❌ 排除(罗织=构陷,非丝织品)

Step 5: 排除规则审查

规则 应用场景 结果
"衣冠"代指士大夫 多处 保留——仍含服饰信息
"罗织"=构陷 行1007 已排除
"僭尘上听"=僭越言语 行462 已排除(非服饰僭制)
"蚕桑"=农政 行117/820/821 已排除
"织"=织役 行89 已排除
"丝竹"=音乐 多处 已排除

排除后有效条目:约25条


操作流程轨迹

文件检查✅(1024行/384KB) → 读取词库✅ → 第1轮grep✅(30+行命中) → 第2轮grep✅(2行命中,1行有效) → 第3轮grep✅(12行命中,4行有效新增) → 排除审查✅(排除约7项) → 有效命中约25条 → 分类整理✅ → 生成3份文件

统计汇总

指标
文件大小 383,867 字节 / 1024 行
第1轮命中行 ~30
第2轮命中行 1
第3轮新增命中行 4
排除误命中 ~7
有效命中行 ~20
有效服饰条目 ~25
服饰类别数 6(官服品色/赐服/冠服制度/清廉象征/便服/女子服饰)