《岭海兰言》服饰内容提取日志

基本信息


操作步骤

第1步:确认文件大小

wc -c 岭海兰言.txt
# 结果:61092 字节(小文件,可直接搜索)

第2步:5轮关键词搜索

① 第一轮:衣裳服冠帽巾带履鞋袜裘袍裙袂衿襟

grep -n '衣\|裳\|服\|冠\|帽\|巾\|带\|履\|鞋\|袜\|裘\|袍\|裙\|袂\|衿\|襟' 岭海兰言.txt

命中行号:6, 52, 54, 58, 60, 72, 74, 155, 159, 253, 262, 267, 334, 335, 336
- 有效服饰行:6(尘襟), 52(衣冠), 72(裙), 74(裙), 253(簮帽檐), 267(衣食), 334(衣冠)
- 噪音行(带=携带/带质,履=践履动词,巾无衣冠义等):54, 58, 60, 155, 159, 262, 335, 336

② 第二轮:丝帛绢锦绮绫罗缎纱绸麻葛布绵毡褐裘

grep -n '丝\|帛\|绢\|锦\|绮\|绫\|罗\|缎\|纱\|绸\|麻\|葛\|布\|绵\|毡\|褐\|裘' 岭海兰言.txt

命中行号:95, 99, 167, 216, 235, 239, 241, 273, 354
- 有效服饰行:235(丝局/操丝)
- 噪音行:95(蛛丝), 99(闭门塞宝非丝帛), 167(苣非绢), 216(胶浆非帛), 239(罗罗-疏朗貌), 241(搜罗-搜聚), 273(素心非帛), 354(兰荪非丝)

③ 第三轮:舆服冠服章服服色品服命服朝服祭服丧服吉服

grep -n '舆服\|冠服\|章服\|服色\|品服\|命服\|朝服\|祭服\|丧服\|吉服' 岭海兰言.txt

结果:无命中

④ 第四轮:佩玉笏簪钗钏环珮鱼袋幞头

grep -n '佩玉\|笏\|簪\|钗\|钏\|环\|珮\|鱼袋\|幞头' 岭海兰言.txt

命中行号:111, 212
- 分析:均为"环"字作"循环/圆环"义,非佩饰之环,属噪音

⑤ 第五轮:织染绣裁缝缫纺练煮

grep -n '织\|染\|绣\|裁\|缝\|缫\|纺\|练\|煮' 岭海兰言.txt

命中行号:70, 135, 214, 233
- 有效服饰行:70(染房), 135(染绛)
- 噪音行:214(贯彻非织), 233(煮鹤-成语)

第3步:上下文提取(小文件前后各5行)

for line in 52 72 253 267 235 70 135 6 60 74 334; do
  sed -n "$((line-5)),$((line+5))p" 岭海兰言.txt | nl -ba -v $((line-5))
done

成功提取11处命中行的上下文。

第4步:噪音过滤

过滤掉以下非服饰内容:
- 第54行"带盐味":带=含有,非服饰之带
- 第58行"带沙质":同上
- 第60行"履而压之":履=践踏动词,非鞋履
- 第111/212行"环":环形/循环义,非佩环
- 第95行"蛛丝":蜘蛛丝,非纺织之丝
- 第214行"贯彻":非织造术语
- 第233行"煮鹤":成语,非纺织

第5步:对抗式学术审查

逐条审视9条有效结果:
1. "衣冠"——比喻用法,非真实服饰描述 ✓保留
2. "裙"——比喻用法,非实物 ✓保留
3. "尘襟"——文学修辞 ✓保留但标注为修辞
4. "茧"——纺织原料比喻 ✓保留
5. "簮帽檐"——真实民俗记载 ✓核心保留
6. "丝局/操丝"——真实手工业记载 ✓核心保留
7. "染房"——真实手工业记载 ✓核心保留
8. "染绛"——染织术语比喻 ✓保留
9. "衣食"——经济用语 ✓保留但标注为非服饰专论

第6步:产出三份MD文档


统计摘要