官常典忠烈部 — 服饰提取日志

一、基本信息

项目 内容
输入文件 /home/z/my-project/upload/part3_extracted/官常典忠烈部.txt
文件行数 4987行
输出目录 /home/z/my-project/upload/p3output/官常典忠烈部/
书名 官常典忠烈部
提取时间 2025年

二、grep执行记录

第1轮:衣、裳、冠、冕、服、裘、袍

第2轮:带、佩、绶、笏、履、舄、靴、鞋

第3轮:巾、帽、幞头、弁、簪、钗、钿

第4轮:锦、绮、绢、帛、罗、纱、绫、缎、绸

第5轮:衮、黼、黻、章服、品色、赐服、朝服

第6轮:旒、珩、璜、琚、瑀、玉佩、鱼袋、革带

第7轮:裙、襦、袄、褐、衫、褙子、深衣、襕衫

第8轮:卤簿、仪仗、旌旗、伞盖、羽葆

三、各轮筛选汇总

轮次 关键词 匹配行数(估) 有效服饰条目 剔除比例
1 衣裳冠冕服裘袍 200+ 21 ~90%
2 带佩绶笏履舄靴鞋 100+ 5 ~95%
3 巾帽幞头弁簪钗钿 <20 3 ~85%
4 锦绮绢帛罗纱绫缎绸 <30 5 ~83%
5 衮黼黻章服品色赐服朝服 <20 8 ~60%
6 旒珩璜琚瑀玉佩鱼袋革带 0 0 N/A
7 裙襦袄褐衫褙子深衣襕衫 <10 3 ~70%
8 卤簿仪仗旌旗伞盖羽葆 2 2 0%
合计 约40条

四、高噪声关键词分析

以下关键词在本书中产生大量"伪匹配"(即匹配了含该字的行,但该字并非服饰义):

关键词 主要非服饰义项 剔除量
服丧、服刑、服戎、降服、征服、服用、佩服 最多
布衣(代指平民)、衣冠(代指士大夫)、衣钵
冠军、冠绝、冠名、加冠(冠礼非服饰)
地带、带领、连带、带甲("甲"为服饰义但"带"非)
履行、履历、步履
钦佩、感佩、佩恩

五、审核流程

  1. 初筛:8轮grep共获取含关键词的行
  2. 复筛:逐行判断该关键词在语境中是否为服饰义
  3. 上下文提取:对确认含服饰信息的行,用sed提取前后文
  4. 分类归档:按衣裳冠服/带佩绶笏/巾帽弁/锦绮绢帛/衮冕朝服/褐衣衫裙/卤簿仪仗7类归档
  5. 去重:同一条目在不同轮次重复匹配时合并

六、质量评估

七、结论

《官常典忠烈部》服饰内容极度稀少(约40条/4987行≈0.8%),8轮grep中第6轮(旒珩璜琚等礼仪器物)零命中,其余轮次大量匹配为非服饰义项噪声。本书不适合作为服饰制度研究的独立文献,仅可作为"服饰与忠烈伦理"交叉研究的补充材料。