兰蕙小史 处理日志

操作记录

步骤1:文件大小确认

wc -c /home/z/my-project/upload/草木鸟兽虫鱼/草木鸟兽虫鱼/兰蕙小史.txt

结果:104415字节(5本书中最大)

步骤2:第1轮搜索——衣裳服冠帽巾带履鞋袜裘袍裙袂衿襟

rg -n '[衣裳服冠帽巾带履鞋袜裘袍裙袂衿襟]' 兰蕙小史.txt

命中约30行。关键命中:赛锦旋(42)、纱帽(74)、衣壳(420/427/460/462)、道袍襟式(454)、饰髻(560)。大量噪音:冠取冠军义(71/126)、服取适应义(71/407)。

步骤3:第2轮搜索——丝帛绢锦绮绫罗缎纱绸麻葛布绵毡褐裘

rg -n '[丝帛绢锦绮绫罗缎纱绸麻葛布绵毡褐裘]' 兰蕙小史.txt

命中约30行。关键命中:赛锦旋(42)、宋锦旋梅(90/91)、纱帽(74)、棕绳为经(340)、纱筋(465)、箨壳布满红砂(243)。大量噪音:丝路/丝额(蟋蟀纹路)、麻路(蟋蟀头部纹路)、布满(分布义)。

步骤4:第3轮搜索——舆服冠服章服服色品服命服朝服祭服丧服吉服

大量泛匹配,主要为"色"字(花色描写)和"服"取适应/服用义。

步骤5:第4轮搜索——佩玉笏簪钗钏环珮鱼袋幞头

大量"玉"字命中(玉蝶、玉梅、玉芙蕖等花名),非佩玉。关键命中:紫绶金章(42)中的"绶"未在此轮捕获(绶不在搜索词中)。

步骤6:第5轮搜索——织染绣裁缝缫纺练煮

命中约10行。关键命中:宋锦旋(90/91)、裁夺(10)、染坊(153)。其余为噪音:裁夺(裁决义)、染字(花名)。

步骤7:噪音过滤

步骤8:对抗式学术审查

步骤9:产出三份MD文档