《浪迹丛谈》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《浪迹丛谈》全部服饰相关内容,整理分类总结 输入:/home/z/my-project/upload/part3/浪迹丛谈.txt(328,644字节)


Step 1: 检查输入文件

```bash wc -c /home/z/my-project/upload/part3/浪迹丛谈.txt

结果:328644 字节(约320KB,中等规模)

```

文件大小未超500KB,但仍遵守"严禁加载整本TXT"规则,使用grep+sed方式。

Step 2: 读取词库

读取 /home/z/my-project/skills/rysxguji/references/fushi-keywords.md,确认: - 核心服饰词:衣、裳、冠、冕、袍、裘、带、佩、巾、帻、履、舄、笏、绶……等87词 - 制度动作词:赐服、赐紫、僭、逾制、品色、冠礼……等15词 - 排除规则表:13条排除场景

Step 3: 第1轮grep — 核心服饰词

```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|……' 浪迹丛谈.txt | wc -l

结果:198 处原始命中

```

Step 4: 分批grep(避免超时)

因全词正则过长导致超时,改为分批搜索:

Step 5: 对抗式审查

逐条审查全部命中,按排除规则表执行排除:

排除类型 条数 典型示例
"带"作方位/动词义 8 "一带"="一片区域"
地名含服饰词 3 珠冠弄、玉带桥、靴儿河
"服"非服饰义 5 服丧、服用、服药
"衣胞"=胎盘 1 非衣服
"黻"署名用字 1 米芾书款
"荷包"容器 2 非佩饰
"甸服"=行政区划 1 非服饰

审查结果:原始198命中 → 排除约170条伪命中 → 保留28条有效服饰内容

Step 6: 分类整理

将28条有效命中分为6类:

  1. 清代官服制度(顶戴、花翎、补服、朝珠、伞盖)→ 6条
  2. 古代冠服与礼仪(衣冠、冕旒、衮龙、翟衣)→ 5条
  3. 佩饰器物(玉带、佩刀、簪、紫罗囊)→ 6条
  4. 足服与便服(屐、靴、棕鞋、貂帽)→ 6条
  5. 服饰典故与诗文(布衣、纨袴、道帔、轻绡等)→ 5条

Step 7: 生成三份文件

文件 路径 大小
总结 浪迹丛谈/浪迹丛谈_服饰内容总结.md ~12KB
原文 浪迹丛谈/yuanwen/浪迹丛谈_服饰内容原文.md ~8KB
日志 浪迹丛谈/log/2026-03-05_浪迹丛谈_日志记录.md ~5KB

操作流程轨迹

读取词库✅ → 分批grep(9批次)✅ → 统计198原始命中 → 对抗式审查(排除~170伪命中)✅ → 保留28条有效✅ → 分类6类✅ → 生成3文件✅

关键发现