明诗别裁集 服饰内容提取日志

基本信息

处理流程

Step 1: wc统计

3311行 338669字节

Step 2: 五轮grep统计

轮次关键词类别匹配行数
1核心词368
2材质178
3色彩纹饰756
4制度3
5配饰21

Step 3: 详细grep+sed提取

衣字词组检索:约18条有效

冠帽类:4条

裙衫袍类

簪钗钿环

制度类:1条

鞋履蓑笠:1条

Step 4: 筛选结果

共筛选出服饰相关条目约22条,分为6类。

Step 5: 审查备注