《客尘医话》服饰检索日志
任务信息
| 项目 | 内容 |
|---|---|
| 任务类型 | 服饰关键词整理 |
| 源文件 | /home/z/my-project/download/part2_extracted/医藏/客尘医话.txt |
| 输出目录 | /home/z/my-project/upload/2output/客尘医话/ |
| 文件行数 | 489行 |
| 文件大小 | 51,686字节 |
检索过程
第一轮:广谱关键词扫描
命令:
grep -n '衣|裳|裙|袍|衫|裘|冠|帽|巾|履|鞋|袜|带|佩|簪|钗|钏|环|珥|褐|绮|罗|缎|绢|纱|帛|锦|绣|丝|绸|缯|绫|绡|褐衣|布衣|朝服|冠带|玉佩|青鞋|锦纹|锦衣|纶巾|葛衣|蓑衣|犀带|角带|束带|衣冠|幅巾' 客尘医话.txt
结果: 命中9行(7, 9, 17, 97, 165, 255, 269, 329, 381)
第二轮:过滤医药伪命中
策略: 排除药名中的服饰字(陈皮、紫苏、苏叶、藿香、桑皮、大腹皮、五加皮、地骨皮、茯苓皮、白术皮、蜜炙、姜皮、佩兰、丝子→菟丝子、丝瓜、艾叶等)
过滤后结果: 命中5行(7, 9, 17, 97, 329)
第三轮:补充关键词验证
命令:
grep -n '钗|钏|环|珥|簪|冠|帽|巾|履|袜|裙|袍|衫|裘|褐|衣冠|布衣|幅巾|蓑|笠' 客尘医话.txt
结果: 未发现新的服饰条目。行9含"鞋"已被收录;行165"带血"、行269"青皮"为医药用词,排除。
第四轮:复合词精确检索
命令:
grep -n '锦纹|绣虎|青鞋|题襟|循衣|绢包|成丝|膏粱|藜藿|粉皮' 客尘医话.txt
结果: 确认5个有效条目,另"成丝""膏粱""藜藿""粉皮"为比喻或饮食用词,不归入服饰类。
第五轮:sed提取上下文
对5个有效行逐一提取原文:
sed -n '7p' 客尘医话.txt
sed -n '9p' 客尘医话.txt
sed -n '17p' 客尘医话.txt
sed -n '97p' 客尘医话.txt
sed -n '329p' 客尘医话.txt
命中条目详表
| # | 行号 | 关键词 | 原文片段 | 归类 | 伪命中排除说明 |
|---|---|---|---|---|---|
| 1 | 7 | 绣 | 幼耽绣虎 | 比喻 | “绣虎"喻文才,非实指刺绣 |
| 2 | 9 | 鞋/襟 | 退出青鞋/题襟之意 | 实指+比喻 | 青鞋实指;题襟用典 |
| 3 | 17 | 锦 | 斑斑如锦纹 | 医学比喻 | 锦纹喻斑疹色 |
| 4 | 97 | 衣 | 循衣撮空 | 医学术语 | 循衣=谵妄症状 |
| 5 | 329 | 绢 | 以绢包炒熟麸皮 | 实用 | 绢作包药材料 |
排除的伪命中
| 行号 | 关键词 | 伪命中原因 |
|---|---|---|
| 165 | 带 | “带血"——"带"为动词,非服饰 |
| 255 | 蕲艾 | “艾"为药名,非"艾衣” |
| 269 | 青皮 | “青皮"为中药名,非"青色皮衣” |
| 381 | 盐水 | 无服饰含义 |
检索结论
- 有效服饰条目:5条
- 伪命中排除:4条
- 本书服饰信息密度:极低(5条/489行 ≈ 1.02%)
- 服饰词汇类型:比喻3处、实指1处、医学术语1处
日志记录完毕