东汉演义
《东汉演义》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 源文件 | /home/z/my-project/upload/演义/演义/东汉演义.txt |
| 文件大小 | 457,423 字节(UTF-8,CRLF) |
| 总行数 | 676 行 |
| 总字符数 | 152,706 字符 |
| 输出目录 | /home/z/my-project/upload/演义output/东汉演义/ |
| 执行时间 | 2026-03-04 |
提取流程
第一轮:核心服饰词
关键词:服饰、服色、冠冕、冕、弁、袍、裘、甲胄、铠甲、锦绣、绶、佩、笏、帻、巾帽、靴、履、舄、裙、袄、褂、衫、褐、朝服、公服、常服、丧服、祭服、衮服、龙袍、蟒袍、补服、品色、舆服、冠服、章服、幞头、鱼袋
结果:58 行命中
主要命中:绶(25次)> 履(7次)> 裘(5次)> 佩(5次)> 冕(3次)> 帻(2次)> 袍(2次)
第二轮:衣冠等级词
关键词:衣裳、衣冠、冠带、带剑、佩剑、服制、赐服、赐紫、赐绯、紫袍、绯袍、绿袍、黄袍、白袍、青袍、布衣、蟒衣、仙鹤、狮子、豹子、补子
结果:13 行命中
主要命中:衣冠(6次)> 布衣(5次)> 衣裳(2次)
第三轮:织物纹饰词
关键词:锦、绣、绫、罗、绸、缎、纱、绢、帛、丝、葛、麻、棉、缂丝、黼黻、文章、纹、章、彩
结果:74 行命中(含大量误匹配)
误匹配分析:
- 章:大量为人名(哀章、王章、豫章等)、奏章、章句,仅”章服”1条有效,过滤后丢弃约30条
- 帛:多为”钱帛”“竹帛”等财物/史册用法,保留20条中约半数与赏赐服饰制度相关
- 麻:”麻乱”“杀人如麻”“麻乡”均非织物义,过滤3条
- 葛:”葛邪塞”为地名,过滤1条
- 文章:2条中1条为”典文章”(掌管文书),非纹章义,过滤
过滤后有效:约 34 条
第四轮:动作状态饰物词
关键词:翠、珰、簪、钗、玉带、金带、银带、革带、丝鞭、冠缨、冠盖、车服、赐衣、更衣、披衣、解衣、衣袂、衣襟、袖、素服、缟素、戎服、戎装、战袍、披甲、戴甲
结果:14 行命中
误匹配分析:
- 珰:”张珰”为人名,过滤1条
过滤后有效:13 条
汇总统计
| 轮次 | 原始命中 | 过滤后有效 |
|---|---|---|
| 第一轮 | 58 行 | 48 行 |
| 第二轮 | 13 行 | 13 行 |
| 第三轮 | 74 行 | 34 行 |
| 第四轮 | 14 行 | 13 行 |
| 补充检索 | — | 6 行 |
| 合计(去重后) | — | 97 行(含补充) |
去重说明
同一行可能匹配多个关键词(如L137同时匹配绶、衣冠、帛、车服;L544同时匹配冠冕、衣裳),去重后共91个独立行号。
分类统计
| 类别 | 条数 | 说明 |
|---|---|---|
| 冠冕礼服制度 | 5 | 韨冕、冠冕衣裳、弁服 |
| 袍服衣裳 | 2 | 蜂袍金甲、袍衣疏粗 |
| 裘服 | 5 | 羊裘、貂裘、贡裘 |
| 甲胄武备 | 5 | 被甲胄、披甲、佩刀 |
| 印绶佩饰 | 26 | 印绶、玺绶、纡佩金紫、玉佩 |
| 帻巾冠履 | 9 | 冠帻、正帻、冠履、剑履上殿 |
| 服色舆服制度 | 3 | 易服色、正朔服色、车服 |
| 丧服缟素 | 1+ | 缟素、素服、弁绖 |
| 布衣庶民 | 5 | 均为”平民”义 |
| 锦绣丝帛织物 | 22 | 绣衣、锦裤、帛布、缣帛等 |
| 翠羽首饰袖袂 | 4 | 翠羽、断袖、领袖 |
| 其他 | 4 | 更衣、冠盖等 |
补充检索
四轮grep完成后,对抗式审查发现遗漏,补充检索以下关键词:
| 关键词 | 新增行号 | 内容 |
|---|---|---|
| 兜鍪 | L443 | 被元甲兜鍪(铠甲部件) |
| 韦裤/布被/裳 | L443 | 身衣韦裤布被,夫人裳不加缘 |
| 徒跣/敝衣 | L307 | 被发徒跣,敝衣赭汗 |
| 免冠 | L51 | 免冠徒跳诣阙 |
| 布被 | L492 | 布被囊而已 |
| 缯练 | L68 | 衣缯练 |
| 缯采 | L354 | 美女缯采赂遗匈奴 |
| 杂缯 | L594 | 杂缯各四百匹 |
同时修正:
- L647”罗侯”为封地名,非丝织品,删除
- L70关键词由”履”修正为”恶衣”(”履礼”为比喻用法)
过滤规则说明
- 章字:仅保留”章服”组合,其他人名/奏章/章句全部过滤
- 帛字:保留”赐帛”“杂帛”“缣帛”“帛布”等与服饰制度相关的用法,”竹帛”仅保留1条(L251,已标注为史册义)
- 麻字:仅保留丧服语境中的”麻”,”麻乱”“如麻”“麻乡”“麻术”全部过滤
- 履字:保留”冠履”“剑履”“衣履”“絇履”等实物/制度用法,”履险”“如履薄冰”“履正”等比喻用法过滤
- 佩字:区分佩刀(武备)、纡佩(官服)、佩侃(非服饰,过滤)
- 裘字:保留”羊裘”“貂裘”“衣裘”等实物用法,”广裘”(广阔义)过滤
- 珰字:”张珰”为人名,过滤
文件输出
| 文件 | 大小 | 说明 |
|---|---|---|
| 原文提取.md | ~15KB | 分类原文摘录,关键词加粗 |
| 总结.md | ~9KB | 分项总结与学术分析 |
| 日志.md | ~5KB | 提取过程与统计 |
| grep_raw.json | — | 四轮grep原始结果 |
| grep_filtered.json | — | 过滤后结果 |
| categorized.json | — | 分类后结果 |
对抗式审查记录
审查1:原文一致性
所有摘录均在原文中找到对应文本 ✓
审查2:遗漏检查
发现并补充6条重要遗漏(兜鍪、韦裤、徒跣、免冠、布被、缯练/缯采/杂缯)✓
审查3:文件大小
三份MD均≤20KB ✓
审查4:印绶占比
印绶相关占27.5%,占比合理 ✓
审查5:硬凑嫌疑
- 布衣5条均为”平民”义,已如实标注 ✓
- L647”罗侯”误收为地名,已删除 ✓
- L70”履礼”误标,已修正为”恶衣” ✓
审查6:数字一致性
各类别条数与总结.md中的叙述一致 ✓