国秀集 服饰提取日志

基本信息

处理流程

步骤1:wc统计

步骤2:5轮grep关键词扫描

轮次关键词类型命中行数
第1轮核心词35
第2轮材质词21
第3轮色彩纹饰110
第4轮制度词6
第5轮配饰词5

步骤3-4:精准提取与筛选

使用Python脚本综合精准提取,命中15行。经人工审核全部为有效服饰内容或合理服饰意象。

步骤5-6:分类整理与输出

分为5类:官服与品级标识、胡服与民族服饰、女性服饰、军事服饰、隐逸服饰。