前后七国志

《前后七国志》服饰提取日志

基本信息

项目 内容
源文件 /home/z/my-project/upload/演义/演义/前后七国志.txt
文件行数 998行
文件大小 约536KB
输出目录 /home/z/my-project/upload/演义output/前后七国志/

提取过程

第一轮grep(服饰核心词)

关键词:服饰 服色 冠冕 冕 弁 袍 裘 甲胄 铠甲 锦绣 绶 佩 笏 帻 巾帽 靴 履 舄 裙 袄 褂 衫 褐 朝服 公服 常服 丧服 祭服 衮服 龙袍 蟒袍 补服 品色 舆服 冠服 章服 幞头 鱼袋

命中行数:约20行
有效条目:羊裘、佩身、布袍草履、羽扇纶巾、衣衫粉碎、袍袖、靴鱼、青袍皂盖、裙钗、绣甲锦袍、冠服、挂冠还带、金盔金甲大红袍丝鸾带、铁盔铁甲皂罗袍乌油铠、衣冠、锦绣、冠履、衮服、朝服、甲胄、盔甲衣袍、破军帽碎夹袄绽皮靴

误命中(已剔除)
- “佩身”(辟尘珠佩身,为佩戴而非服饰)
- “袍袖”(拂袍袖为施法动作,非服饰描写)
- “履”在”草履”中已计入;”靴鱼”为鱼名,但衍生出靴子制作

第二轮grep(服饰组合词)

关键词:衣裳 衣冠 冠带 带剑 佩剑 服制 赐服 赐紫 赐绯 紫袍 绯袍 绿袍 黄袍 白袍 青袍 布衣 蟒衣 仙鹤 狮子 豹子 补子

命中行数:约5行
有效条目:青袍、衣冠、衣帽、衣裳
新增信息:无重大新增,与第一轮重叠较多

未命中词:赐紫、赐绯、紫袍、绯袍、绿袍、黄袍、白袍、蟒衣、仙鹤、狮子、豹子、补子、幞头——本书不含这些词汇

第三轮grep(织物与纹样词)

关键词:锦 绣 绫 罗 绸 缎 纱 绢 帛 丝 葛 麻 棉 缂丝 黼黻 文章 纹 章 彩

命中行数:约40行(大量误命)
有效条目:彩帛、锦囊、红罗、红锦套索、玉帛、绫锦缎帛、绫锦百端、彩缎绫罗、罗锦百端、锦缎、锦帛、蜀锦、绣甲锦袍、金银彩缎、布帛衣裳、锦衣武士

误命中(已剔除)
- “绣花针”(针线活,非服饰)
- “文章”(此处意为”文辞”,非纹章)
- “章”单字大量误命(章节、表章、令旨等)
- “彩”在”杂彩”“喝彩”“五彩”中多为形容词或叹词
- “丝”在”丝鸾带”“丝鞭”中为材质修饰
- “锦绣”在”六宫之锦绣绝观”中为借代(指华美之物)

第四轮grep(配饰与动作词)

关键词:翠 珰 簪 钗 玉带 金带 银带 革带 丝鞭 冠缨 冠盖 车服 赐衣 更衣 披衣 解衣 衣袂 衣襟 袖 素服 缟素 戎服 戎装 战袍 披甲 戴甲

命中行数:约20行
有效条目:玉带宝剑、八卦冠白玉带、素服方巾、钗环首饰、披麻执杖、戎装、袍袖、披甲、朝服、冠簪、轻裘缓带

误命中(已剔除)
- “袖”大量误命(”拂袖入宫”“袖中取出”“拂袍袖”为动作)
- “丝鞭”未出现
- “冠盖”未出现
- “更衣/披衣/解衣”未出现


统计

统计项 数量
四轮grep总命中行 约85行
去重后命中行 约55行
人工筛选后有效条目 约35处
剔除误命条目 约20处
分类数 9大类

服饰关键词命中/未命中统计

关键词 命中 关键词 未命中
幞头
鱼袋
甲胄/铠甲 赐紫/赐绯
朝服 紫袍/绯袍/绿袍
衮服 白袍/蟒衣
冠服 仙鹤/补子
黼黻/缂丝
缟素
战袍
戴甲
锦/绣/绫/罗/帛 翠/珰
玉带 金带/银带/革带
冠簪 冠缨/冠盖
戎装 更衣/披衣/解衣

质量控制

已执行的检查

  1. 去伪:逐条审阅grep结果,剔除与服饰无关的用例(如”袖占一卦”“拂袍袖”“袖中取出”等动作用法)
  2. 去重:同一服饰条目在不同轮次重复命中时合并
  3. 语境核实:对每条有效结果回读原文上下文,确认服饰含义
  4. 关键词覆盖:四轮关键词共约100个,覆盖了词库要求的主要类别

已知局限

  1. “绣”字单独命中过多(绣花针、绣甲等),部分为手工作艺而非服饰
  2. “章”字单字误命极多(章节、表章),已全部剔除
  3. “彩”字在”杂彩”“喝彩”中与服饰无关,已剔除
  4. 第四轮”袖”字误命率最高(约80%为动作用法),已严格筛选
  5. 本书为明清演义,服饰描写本就不丰富,有效条目偏少

输出文件

文件 大小 说明
原文提取.md ~8KB 分类整理的服饰相关原文段落
总结.md ~7.5KB 服饰内容分析与评估
日志.md 本文件 提取过程记录