新安文献志 服饰内容提取日志

基本信息

处理策略

超大型文件,采用grep -c统计+精选sed提取策略,不做全量展开。

处理流程

Step 1: wc统计

6367行 2875898字节

Step 2: 五轮grep -c统计

轮次关键词类别匹配行数
1核心词947
2材质601
3色彩纹饰1827
4制度67
5配饰187

第4轮制度类67行为七书最高,反映本志大量碑传墓志中的品服制度记载。

Step 3: 精选sed提取

采用分类关键词精筛策略:

赐服/品服制度

深衣考据

象刑服饰

丧服制度

历代服饰风俗

金国服饰

后妃冠服

Step 4: 筛选结果

精选服饰相关重点条目约30条,分为6大类。因文件超大,仅提取最具史料价值者。

Step 5: 审查备注