古诗纪 服饰提取日志

操作时间:2026-03-05
文件:/home/z/my-project/upload/诗集/诗集/古诗纪.txt
总行数:19205

操作记录

步骤1:文件大小检查

wc -l 古诗纪.txt
# 结果:19205行(5书中最大,约3.5倍于古今禅藻集)

步骤2:5轮精确词组grep统计

轮次关键词类匹配行数
1核心服饰词组522
2材质150
3色彩纹饰34
4制度19
5配饰230

注意:第1轮522行、第5轮230行匹配量极大,无法逐行人工审读,采用精选策略。

步骤3:精选策略

因全书19205行,522+230=752行含核心词,采取以下策略:

  1. 第4轮(制度词19行)全部审读——制度词最精确
  2. 第3轮(色彩34行)全部审读
  3. 第1轮精选前80行+关键条目
  4. 第2轮精选重要材质词
  5. 第5轮精选关键配饰词

步骤4:关键发现

通过精选审读,发现以下5书唯一或最佳条目:

步骤5:分类整理

最终提取有效服饰片段约120条(精选),分5大类:

步骤6:审查


关键发现

  1. 最有制度史料价值的5条
  1. 最有文学价值的3条
  1. 全书服饰密度:约2.7%(522条/19205行),5书最高
  1. 特色:先秦礼制服饰(士冠礼、衮衣章甫、服饰僭越)为5书之冠