交谊典故旧部 服饰提取日志
操作流程
步骤1:文件统计
- 命令:
wc -c /home/z/my-project/upload/part1_extracted/交谊典故旧部.txt
- 结果:27,475 字节
- 判断:文件小于30KB,但遵守铁律不整本载入
步骤2:五轮词库grep搜索
第1轮:衣裳冠冕巾帽袍衫裙裘带佩履舄靴
- 命令:
grep -n "衣裳|冠冕|巾帽|袍衫|裙裘|带佩|履舄|靴"
- 结果:零命中(整词未匹配,拆分后单独命中)
- 备注:原文为古文无标点,复合词可能跨字出现
第2轮:服色舆服冠服章服朝服祭服丧服吉服常服公服
- 命令:
grep -n "服色|舆服|冠服|章服|朝服|祭服|丧服|吉服|常服|公服"
- 结果:零命中
- 判断:本文不涉服制制度类内容
第3轮:丝帛绢锦绮绫罗缎绸缂丝葛麻布褐
- 命令:
grep -n "丝帛|绢|锦|绮|绫|罗|缎|绸|缂丝|葛|麻布|褐"
- 结果:命中——行3、10、14、38、69、75
- 命中词:罗(罗生、罗巾、罗带)、锦(锦笺)、麻(麻枲)、褐(未独立命中)
- 去伪:罗生(草木滋生,非织物)→排除;锦笺(信笺,非衣料)→排除
第4轮:紫袍绯袍绿袍赐紫赐绯鱼袋笏幞头金带玉带
- 命令:
grep -n "紫袍|绯袍|绿袍|赐紫|赐绯|鱼袋|笏|幞头|金带|玉带"
- 结果:零命中
- 判断:本文不涉品服官服制度
第5轮:旂旗章珮环玦簪钗钿翠珠玉
- 命令:
grep -n "旂|旗章|珮|环玦|簪钗|钿|翠|珠玉"
- 结果:命中——行14、38、75
- 命中词:翠(翠袖、翠蛾)、簪(瑶簪、亡簪、蓍簪)
- 去伪:翠蛾(眉饰,非服饰)→排除;旌旗(旗帜,非服饰)→排除
步骤3:补充搜索(扩大召回)
- 搜索单字/双字:衣、袍、裘、衫、巾、簪、屦、袒、帷、貂、被、裾、帕、袂、冠、弁、履、褐
- 新增命中词汇:绨袍、布衣、头巾、毳袍、帕首、青衫、短衣、窄袖、狐裘、黑貂裘、敝衣、裹头、武弁、端冕、貂蝉、总角、曳裾、坠屦、布被、帷帐、授衣、肉袒、满衣、涴客衣、拂衣、衣褪、分袂、襟袖、襟畔、把袖、罗巾
步骤4:逐条审查
- 共审查39条记录
- 排除项:罗生(非织物)、翠蛾(眉饰)、旌旗(军旗)、金勒(马具)、锦笺(纸笺)、手板(非服饰持物)
- 保留项:均为原文直接出现的服饰词汇,无编造
步骤5:分类归档
- 分8大类:上衣袍服、首服头饰、袖襟裙裾、配饰佩物、履舄鞋足、礼服丧仪、被服帷帐、衣之动用
步骤6:生成三MD文件
- 交谊典故旧部_总结.md:分类汇总表 + 核心发现
- 日志.md:本文件,操作全记录
- 原文提取.md:按行号提取原文服饰相关段落
关键词命中汇总
| 轮次 |
命中关键词数 |
排除伪命中 |
有效关键词 |
| 第1轮 |
0 |
0 |
0 |
| 第2轮 |
0 |
0 |
0 |
| 第3轮 |
3(罗/锦/麻) |
2(罗生/锦笺) |
1(麻枲) |
| 第4轮 |
0 |
0 |
0 |
| 第5轮 |
2(翠/簪) |
1(翠蛾) |
1(簪) |
| 补充搜索 |
30+ |
0 |
28 |
| 合计 |
35+ |
3 |
28种 |
文件大小验证
- 交谊典故旧部_总结.md:待测
- 日志.md:待测
- 原文提取.md:待测
↑