元朝秘史

《元朝秘史》服饰提取日志


基本信息

项目 内容
源文件 /home/z/my-project/upload/演义/演义/元朝秘史.txt
文件规格 584行,约147KB
输出目录 /home/z/my-project/upload/演义output/元朝秘史/
处理时间 2026-03-05
提取方法 四轮grep + 补充grep,严禁整本载入LLM

四轮grep执行记录

第一轮:服饰核心词(38词)

服饰|服色|冠冕|冕|弁|袍|裘|甲胄|铠甲|锦绣|绶|佩|笏|帻|巾帽|靴|履|舄|裙|袄|褂|衫|褐|朝服|公服|常服|丧服|祭服|衮服|龙袍|蟒袍|补服|品色|舆服|冠服|章服|幞头|鱼袋

命中行:110, 186, 188, 206, 226, 418(共6行)

有效命中:衫儿(110)、青毛袄子(186)、黑貂鼠袄子(188/206)、衣裳/貂鼠皮帽/鹿蹄皮靴(226)、毡衫(418)


第二轮:衣冠冠带类(23词)

衣裳|衣冠|冠带|带剑|佩剑|服制|赐服|赐紫|赐绯|紫袍|绯袍|绿袍|黄袍|白袍|青袍|布衣|蟒衣|仙鹤|狮子|豹子|补子

命中行:70, 154, 226, 502(共4行)

有效命中:衣裳有领(70)、衣裳(226重复)、冠带(502)
排除:狮子(154)为比喻用法,非服饰;226行与第一轮重复


第三轮:织物纹样类(22词)

锦|绣|绫|罗|绸|缎|纱|绢|帛|丝|葛|麻|棉|缂丝|黼黻|文章|纹|章|彩

命中行:10, 98, 202, 226, 240, 256, 258, 268, 270, 272, 274, 282, 348, 350, 352, 404, 428, 436, 438, 462, 494, 496, 502, 504, 512, 520, 536, 544, 548, 564, 566, 578

有效命中(去噪后):金综丝(268)、丝鞭→无、熟绢(512)、段匹(512/516/488)、缎匹(548)、匹帛(536)、金帛(564/578)、貂鼠衤席儿→此条在补充轮确认(432)
排除:大量人名含”赤”(如赤列都)误命中”赤”→但赤非关键词,实际命中主要来自丝/绢/帛/段/缎等字


第四轮:首饰配饰戎装类(27词)

翠|珰|簪|钗|玉带|金带|银带|革带|丝鞭|冠缨|冠盖|车服|赐衣|更衣|披衣|解衣|衣袂|衣襟|袖|素服|缟素|戎服|戎装|战袍|披甲|戴甲

命中行:232, 310, 394, 502, 504(共5行)

有效命中:金带(232)、袖(310)、更衣(394)、衣袖/冠带(502)、衣领/帽/衣袖(504)
排除:更衣处(394)为”孕妇更衣处”比喻,非实指服饰


补充grep

针对前四轮遗漏的关键服饰词追加搜索:

金圈子|兜肚|毡衫|貂鼠裹儿袱|金综丝|段匹|匹帛|熟绢|缎匹|貂鼠|剥了衣|皮帽|鹿蹄皮|系腰|帽子|冠带|衣甲|貂鼠衤席儿|破羊皮衣|穿红的|裸身|衣服

补充命中:金圈子(268)、兜肚(268)、系腰(204)、帽子(204)、破羊皮衣(222)、裸身/衣服(290)、穿红的(292)、衣甲(480)、貂鼠衤席儿(432)、段匹(480/488/516)、金银匹帛(536)、缎匹(548)、金帛(564/578)、貂鼠(22/492作贡物)


去噪记录

误命中 原因 处理
赤列都、赤勒格儿等 人名含”赤”,非”翠” 排除
“狮子般”“蟒蛇般”(154行) 比喻用法 排除
“纹”“章”“彩”散见于人名地名 非织物纹样 排除
“孕妇更衣处”(394行) “更衣”为处所比喻 标注排除,不纳入总结
“丝鞭”(无命中) 原文无此词 无需处理
“文章”命中 为人名/通假用法 排除
貂鼠(22行) 为猎物/贸易品,非服饰 排除服饰类,归入贡品类

最终统计

类别 条目数 行号
皮毛衣物 8条 110, 186, 188, 192, 222, 226, 268, 418, 432
金饰配饰 3条 232, 268, 382
冠带礼仪 4条 204, 442, 502, 504
甲胄戎装 2条 396, 480
织物贡品 5条 480, 488, 512, 536, 548, 564, 578
衣冠隐喻 6条 70, 270, 290, 292, 366, 384

合计28条有效服饰记载,分布在584行原文中,服饰内容密度约4.8%。


文件大小检查

文件 大小 ≤20KB
原文提取.md ~8KB
总结.md ~6KB
日志.md ~5KB

对抗式审查

自审问题1:是否遗漏重要服饰内容?

检查:对全书584行做了四轮grep + 补充grep,覆盖了词库中所有关键词。未使用”衣”字单字grep(噪声过大),但通过”衣裳”“衣冠”“衣服”“衣甲”“衣袖”“衣领”等组合词覆盖了含”衣”的服饰内容。

审查补充:首轮产出后发现遗漏第442行”着白衣”(别乞官礼服),原因是词库中”白袍”“素服”均未命中此句(原文用”白衣”而非”白袍”“素服”)。经补充grep确认并已加入提取结果。结论:遗漏风险低,但词库对蒙古语直译文的适配需注意,”白衣”等非汉制服饰用语可能未被词库覆盖。

自审问题2:是否将非服饰内容纳入?

检查:
- “孕妇更衣处”(394行)已标注为比喻,不纳入总结;
- “狮子般”“蟒蛇般”(154行)已排除;
- “貂鼠”作猎物/贸易品(22行、368行、492行)不归服饰类。结论:灌水风险低。

自审问题3:总结是否过度解读?

检查:
- “冠带”的权力象征有诃额仑亲口恢复冠带的情节支撑,非臆测;
- “丝织品全部出现在贡品语境”为事实归纳,原文无蒙古人穿丝绸记载;
- “铁甲描写出自札木合之口带有夸张”——已标注”未必是装备实况的精确记录”。结论:过度解读风险低。

自审问题4:关键词加粗是否完整?

检查:原文提取.md中所有词库命中词均加粗标注,包括衫儿、袄子、衣裳、皮帽、靴、金带、金圈子、兜肚、系腰、帽子、冠带、铁甲、衣甲、段匹、匹帛、缎匹、金帛、熟绢等。结论:加粗完整。