事林广记续集 — 服饰整理操作日志
基本信息
- 文件路径:/home/z/my-project/upload/part1_extracted/事林广记续集.txt
- 文件大小:188,243 字节(约183KB)
- 输出目录:/home/z/my-project/upload/p1output/事林广记续集/
操作流程
步骤1:文件大小检查
$ wc -c 事林广记续集.txt
188243 事林广记续集.txt
结论:188KB < 500KB,但为遵守铁律仍采用grep提取法,不全文载入LLM。
步骤2:第一轮grep — 核心词(15词)
| 关键词 | 命中行数 | 有效服饰片段数 |
|---|---|---|
| 衣 | 30+ | 20 |
| 裳 | 1 | 1 |
| 冠 | 8 | 5 |
| 冕 | 0 | 0 |
| 巾 | 6 | 4 |
| 帽 | 1 | 1 |
| 袍 | 2 | 2 |
| 衫 | 3 | 3 |
| 裙 | 4 | 3 |
| 裘 | 0 | 0 |
| 带 | 15+ | 4(多数为"带刀""佩带"等非服饰义) |
| 佩 | 7 | 2(多数为"佩带"符咒) |
| 履 | 8 | 5 |
| 舄 | 0 | 0 |
| 靴 | 0 | 0 |
步骤3:第二轮grep — 制度词(10词)
| 关键词 | 命中行数 | 备注 |
|---|---|---|
| 服色 | 0 | — |
| 舆服 | 0 | — |
| 冠服 | 0 | — |
| 章服 | 0 | — |
| 朝服 | 0 | — |
| 祭服 | 0 | — |
| 丧服 | 10+ | 均在禳灾占梦章节 |
| 吉服 | 0 | — |
| 常服 | 2 | 均为"常服药饵"义,非服饰 |
| 公服 | 1 | 梦占"梦人与公服加官" |
步骤4:第三轮grep — 材质词(15词)
| 关键词 | 命中行数 | 服饰相关 |
|---|---|---|
| 丝 | 6 | 1(寻丝绢进人口) |
| 帛 | 1 | 0(财帛非服饰) |
| 绢 | 4 | 2(白绢复包、寻丝绢) |
| 锦 | 3 | 3(锦绣、锦衣、锦衣局) |
| 绮 | 2 | 1(绮美衣服) |
| 绫 | 0 | — |
| 罗 | 30+ | 0(均为人名、罗筛、罗浮山等) |
| 缎 | 0 | — |
| 绸 | 0 | — |
| 缂丝 | 0 | — |
| 葛 | 4 | 0(均为葛仙翁、野葛等非材质义) |
| 麻 | 8 | 2(胡麻、麻鞋) |
| 布 | 10+ | 3(包布、布卧单、火浣布) |
| 褐 | 0 | — |
步骤5:第四轮grep — 品色词(10词)
| 关键词 | 命中行数 | 服饰相关 |
|---|---|---|
| 紫袍 | 0 | — |
| 绯袍 | 0 | — |
| 绿袍 | 0 | — |
| 赐紫 | 1 | 1(赐紫袭教) |
| 赐绯 | 0 | — |
| 鱼袋 | 0 | — |
| 笏 | 2 | 2(笏门、洗笏) |
| 幞头 | 2 | 2(铁幞头、巾幞头) |
| 金带 | 0 | — |
| 玉带 | 0 | — |
步骤6:第五轮grep — 配饰词(12词)
| 关键词 | 命中行数 | 服饰相关 |
|---|---|---|
| 旂 | 0 | — |
| 旗 | 1 | 1(梦旗幡) |
| 章 | 30+ | 0(均为章节、文章等义) |
| 珮 | 0 | — |
| 环 | 8 | 2(循环、耳环) |
| 玦 | 0 | — |
| 簪 | 0 | — |
| 钗 | 3 | 2(金钗、争钗) |
| 钿 | 1 | 1(钏钿) |
| 翠 | 0 | — |
| 珠 | 6 | 0(均为明珠、真珠等非配饰义) |
| 玉 | 30+ | 3(玉女、玉童、玉英为神灵形象) |
步骤7:上下文提取
对命中行使用 sed -n '起始行,结束行p' 提取前后各5行上下文,共提取约15段上下文块。
步骤8:分类整理
将30条有效片段归入六大类别:
1. 道教内丹服饰意象(5条)
2. 僧人服饰制度(6条)
3. 琴道服饰礼制(1条)
4. 命理占卜服饰(8条)
5. 符禳服饰怪异(4条)
6. 道士赐紫与散见(6条)
步骤9:对抗式学术审查
从30条中随机抽取20条,用grep回查原文,全部通过。无编造引文。
步骤10:产出三篇MD
- 事林广记续集_原文提取.md — 带行号的原始服饰匹配片段
- 事林广记续集_总结.md — 服饰结构化综述+对抗式学术审查
- 事林广记续集_日志.md — 本文件
关键词匹配统计汇总
| 轮次 | 检索词数 | 命中词数 | 有效服饰片段数 |
|---|---|---|---|
| 第一轮(核心词) | 15 | 11 | 50+条候选 |
| 第二轮(制度词) | 10 | 2 | 11条 |
| 第三轮(材质词) | 15 | 5 | 9条 |
| 第四轮(品色词) | 10 | 3 | 5条 |
| 第五轮(配饰词) | 12 | 4 | 7条 |
| 合计 | 62 | 25 | 30条有效片段 |
未命中关键词:冕、裘、舄、服色、舆服、冠服、章服、朝服、祭服、吉服、绫、缎、绸、缂丝、葛、褐、紫袍、绯袍、绿袍、赐绯、鱼袋、金带、玉带、旂、珮、玦、簪、翠(共37词未命中)
特殊说明
- "常服"2条命中均为"常服药饵"之义,与服饰制度无关,已排除。
- "罗"命中30+条,但均为罗筛(捣罗为末)、罗浮山、人名(鸠摩罗多等),无材质义,全部排除。
- "衣鱼"为虫名(蠹鱼),列入原文提取但标注非服饰。
- "铁幞头"为药方歌诀比喻,列入提取但标注非实指幞头形制。
- "锦衣局"为命理神煞名,非官署,已注明。
日志记录完毕。