文氏五家集 服饰内容提取日志

基本信息

处理流程

Step 1: wc统计

2801行 268399字节

中等规模文件,可全量处理。

Step 2: 五轮grep统计

轮次关键词类别匹配行数
1核心词419
2材质198
3色彩纹饰726
4制度4
5配饰19

Step 3: 详细grep+sed提取

采用2字词组精筛+分类检索策略:

衣字词组检索:约18条有效

冠帽类检索:约7条有效

裙衫袍类检索:约5条有效

制度类检索:3条有效

簪钗钿环类:3条有效

佩绶带类:约5条有效

蓑笠/鞋屐类:2条有效

袈裟类:2条有效

Step 4: 筛选结果

共筛选出服饰相关条目约35条,分为7类。

Step 5: 审查备注