后三国石珠演义
后三国石珠演义——服饰提取日志
基本信息
- 书名:后三国石珠演义
- 文件:/home/z/my-project/upload/演义/演义/后三国石珠演义.txt
- 总行数:1173行,约374KB
- 输出目录:/home/z/my-project/upload/演义output/后三国石珠演义/
Grep执行记录
第一轮关键词(服饰冠冕类)
- 关键词:服饰|服色|冠冕|冕|弁|袍|裘|甲胄|铠甲|锦绣|绶|佩|笏|帻|巾帽|靴|履|舄|裙|袄|褂|衫|褐|朝服|公服|常服|丧服|祭服|衮服|龙袍|蟒袍|补服|品色|舆服|冠服|章服|幞头|鱼袋
- 命中行数:24行
- 主要命中:衮龙服、道袍、布衫、裘、甲胄、铠甲、锦绣、佩、笏(简)、靴、履、戎服、吉服、衮服、冕旒、袍(含白袍/红袍/青袍/黄袍/战袍)
第二轮关键词(衣裳品色类)
- 关键词:衣裳|衣冠|冠带|带剑|佩剑|服制|赐服|赐紫|赐绯|紫袍|绯袍|绿袍|黄袍|白袍|青袍|布衣|蟒衣|仙鹤|狮子|豹子|补子
- 命中行数:14行
- 主要命中:衣裳、衣冠、冠带、带剑、佩剑、袍色(白袍/红袍/黄袍/青袍)
第三轮关键词(织物纹彩类)
- 关键词:锦|绣|绫|罗|绸|缎|纱|绢|帛|丝|葛|麻|棉|缂丝|黼黻|文章|纹|章|彩
- 命中行数:98行
- 噪声情况:较高。”锦”字大量用于”锦城”(地名)、”锦标”等非服饰语境;”绣”多用于”绣旗”“绣床”等;”章”多用于”表章”(奏章);”彩”多用于”彩色”“彩仗”等;”丝”用于”金丝草”(植物);”麻”出现极少;”帛”多用于”布帛”“书帛”
- 有效命中:约25行
第四轮关键词(配饰戎装类)
- 关键词:翠|珰|簪|钗|玉带|金带|银带|革带|丝鞭|冠缨|冠盖|车服|赐衣|更衣|披衣|解衣|衣袂|衣襟|袖|素服|缟素|戎服|戎装|战袍|披甲|戴甲
- 命中行数:31行
- 主要命中:翠、钗(金钗)、玉带、披衣、解衣、袖(大袖)、戎服、戎装、战袍、铠甲
- 噪声:”翠”多用于”翠微壁”“翠竹”等非服饰语境;”袖”用于”大袖”“拂袖”等
四轮合并去重统计
- 合并总行数(去重前):167行
- 去重后有效服饰相关行:约60行
- 噪声比例:约64%(主要来自第三轮”锦”“绣”“章”“彩”等高频字)
提取策略说明
- 第一轮最为精准,命中率高,涵盖核心服饰名词
- 第二轮补充了袍色与衣冠制度关键词,命中适中
- 第三轮噪声最高,需人工过滤”锦城”“表章”“金丝草”等非服饰用法
- 第四轮配饰类关键词命中分散,”翠”“袖”噪声较大
对抗式审查
漏检风险
- “裙”字:grep未检出任何”裙”字,全书可能确实无裙装描写,但需留意是否有同义替代词
- “绶”字:未检出,书中官制描写较少涉及绶带
- “幞头”:未检出,晋代尚无幞头(唐代始盛),符合历史背景
- “鱼袋”:未检出,同上,唐代制度
误判检查
- “锦城”(第892行)为地名(成都别称),已排除
- “表章”(多处)为奏章,已排除
- “金丝草”(第892行)为植物名,已排除
- “翠微壁”“翠竹”(第61/1145行)为景物,已排除
- “文章”(多处)为文辞,已排除
- “锦绣衣裳”(第675行)为诗句中的服饰描写,已保留
- “彩缎”(第82/323/328行)为实物面料,已保留
内容可靠性
- 所有原文引用均标注行号,可溯源验证
- 服饰分类基于原文语境判断,未做过度解读
- 五行阵服色体系为本书最系统的服饰制度描写,价值最高
输出文件
- 原文提取.md —— 按十大类归档,关键词加粗
- 总结.md —— 五大板块分析+制度要点+特殊发现
- 本日志