国秀集 服饰提取日志
基本信息
- 书名:国秀集
- 文件:/home/z/my-project/upload/诗集/诗集/国秀集.txt
- 输出目录:/home/z/my-project/upload/诗集output/国秀集/
- 文件规模:610行,42506字节
处理流程
步骤1:wc统计
- 行数:610
- 字节数:42506
- 为中型唐诗选集
步骤2:5轮grep关键词扫描
| 轮次 | 关键词类型 | 命中行数 |
|---|---|---|
| 第1轮 | 核心词 | 35 |
| 第2轮 | 材质词 | 21 |
| 第3轮 | 色彩纹饰 | 110 |
| 第4轮 | 制度词 | 6 |
| 第5轮 | 配饰词 | 5 |
步骤3-4:精准提取与筛选
使用Python脚本综合精准提取,命中15行。经人工审核全部为有效服饰内容或合理服饰意象。
步骤5-6:分类整理与输出
分为5类:官服与品级标识、胡服与民族服饰、女性服饰、军事服饰、隐逸服饰。