《东西晋演义》服饰提取日志
基本信息
| 项目 |
内容 |
| 源文件 |
/home/z/my-project/upload/演义/演义/东西晋演义.txt |
| 文件行数 |
3464行 |
| 文件大小 |
约1.2MB |
| 输出目录 |
/home/z/my-project/upload/演义output/东西晋演义/ |
| 处理时间 |
2026-03-05 |
提取流程
第一轮grep(服饰制度核心词)
- 关键词:服饰 服色 冠冕 冕 弁 袍 裘 甲胄 铠甲 锦绣 绶 佩 笏 帻 巾帽 靴 履 舄 裙 袄 褂 衫 褐 朝服 公服 常服 丧服 祭服 衮服 龙袍 蟒袍 补服 品色 舆服 冠服 章服 幞头 鱼袋
- 命中:97行
- 有效服饰描写:约55条
第二轮grep(颜色与等级标识词)
- 关键词:衣裳 衣冠 冠带 带剑 佩剑 服制 赐服 赐紫 赐绯 紫袍 绯袍 绿袍 黄袍 白袍 青袍 布衣 蟒衣 仙鹤 狮子 豹子 补子
- 命中:25行
- 有效服饰描写:约18条
- 注:紫袍/绯袍/绿袍/黄袍/白袍/青袍/赐紫/赐绯/蟒衣/仙鹤/狮子/豹子/补子/服制/祭服/常服等关键词在本书中均无命中——东西晋题材演义不涉及唐以后品色服制度
第三轮grep(丝织品与纹饰词)
- 关键词:锦 绣 绫 罗 绸 缎 纱 绢 帛 丝 葛 麻 棉 缂丝 黼黻 文章 纹 章 彩
- 命中:240行(原始)→ 170行(去除”文章”“纹”“章”等高频误命中)
- 有效服饰描写:约15条
- 误命中分析:”章”多用于”章武”“豫章”“章奏”等地名人名公文;”纹”几无命中;”文章”多指文才而非服纹;”彩”多用于”光彩”“五彩祥云”非服饰语境
第四轮grep(首饰与动作词)
- 关键词:翠 珰 簪 钗 玉带 金带 银带 革带 丝鞭 冠缨 冠盖 车服 赐衣 更衣 披衣 解衣 衣袂 衣襟 袖 素服 缟素 戎服 戎装 战袍 披甲 戴甲
- 命中:30行
- 有效服饰描写:约22条
- 注:珰/冠缨/衣袂/衣襟/战袍/戴甲/银带/革带在本书中无命中
去重与合并
- 四轮合计原始命中:约392条次
- 按行号去重后:303个唯一行
- 人工筛选有效服饰描写:约80条
- 淘汰率:约73.6%
主要淘汰原因
- “章”字误命中:豫章王、章武吏、章奏等与服饰无关(约40条)
- “彩”字误命中:光彩、五彩祥云等非服饰语境(约20条)
- “帛”字误命中:金帛、布帛作为财物赏赐而非服饰(约15条)
- “丝”字误命中:丝竹(乐器)、丝鞭(非服饰)等(约10条)
- “佩”字误命中:佩服、钦佩等心理描写(约5条)
- “翠”字误命中:翠华楼(建筑名)等(约3条)
- “履”字误命中:履行(动词)等(约5条)
- 袍罕/枹罕:地名,非袍服(3条)
分类体系
最终80条有效描写分为9类:
| 类别 |
条数 |
核心关键词 |
| 朝服与礼仪服饰 |
17 |
朝服、公服、冠冕、剑佩上殿、章服印绶 |
| 戎装与军事服饰 |
20 |
甲胄、披甲、戎服、戎衣、铠、缟素 |
| 奢华服饰与丝织品 |
8 |
锦绣、锦步障、紫丝步障、罗縠、锦绮、练帛 |
| 冠帽与首饰佩饰 |
11 |
貂蝉、帻、帽、玉带、玉簪、雀钗、珥金翠 |
| 丧服与素服 |
6 |
缟素、素服、白衣、慢服 |
| 布衣与平民服饰 |
10 |
布衣、披褐、卖履、失履、蓬头跣足 |
| 佩剑与带剑 |
10 |
佩剑、带剑、佩刀、腰带宝剑、笏 |
| 印绶与服饰制度 |
14 |
玺绶、金章紫绶、裂冠毁冕、车服礼章 |
| 武帝节俭 |
3 |
青麻代丝、衣无文彩、衣帛有制 |
未命中关键词记录
以下词库关键词在本书中完全无命中,反映东西晋题材的服饰特征:
| 未命中关键词 |
分析 |
| 龙袍/蟒袍/衮服 |
帝王描写不用具体服名,仅称”乘舆”“銮驾” |
| 补服/补子/品色 |
唐以后制度,晋代无此概念 |
| 赐紫/赐绯/紫袍/绯袍 |
同上,唐代始行品色服 |
| 仙鹤/狮子/豹子 |
明代补子纹样,不适用于晋 |
| 幞头 |
隋唐以后冠帽,晋代无 |
| 鱼袋 |
唐代制度 |
| 裙/袄/褂 |
本书无女性日常服饰描写 |
| 靴 |
无命中,武将用”甲”“铠”代指 |
| 银带/革带 |
无命中,仅”玉带”“腰带” |
| 黼黻/缂丝 |
无命中,高等级纹饰在演义中不出现 |
| 珰 |
无命中,耳饰仅”珥金翠” |
| 冠缨/衣袂/衣襟 |
无命中 |
质量自检
已确认的准确性
- 所有引用行号均经原文逐行核对
- 关键词加粗标注均对应原文实际用词
- 阮咸”锦绣炫目”故事出现两次(行266与行1427),已标注为同一故事重复
- “袍罕”“枹罕”确认为地名,未收入服饰描写
- “扪虱而言”非服饰描写,已排除
可能的遗漏
- 隐含服饰描写(如”更衣”在某些语境下可能涉及换装)未全部收录
- “鸾驾”“銮驾”等仪仗词未纳入(属车舆而非服饰)
- “流苏武帐”为帐幔而非服饰,仅收录1条
- 第三轮”纹”“章”误命中较多,可能遗漏个别真实服纹描写
对抗式审查
- [x] 无整本载入LLM
- [x] 先grep+sed提取再处理
- [x] 每篇MD≤20KB
- [x] 据实撰写不灌水
- [x] 已做误命中分析
- [x] 已记录未命中关键词
- [x] 已标注重复条目
- [x] 已区分地名与服饰词
输出文件清单
| 文件名 |
大小 |
说明 |
| 原文提取.md |
11,845字节 |
按类别整理的原文摘录,关键词加粗 |
| 总结.md |
8,435字节 |
系统性分析总结,含10个章节 |
| 日志.md |
本文件 |
提取流程、去重分析、质量自检 |