《伤寒论集注》服饰内容提取 · 操作日志
任务ID:batch18 时间:2026-04-22 书籍:伤寒论集注(医藏第88本)
操作流程
Step 1: 基本信息
- 文件:/home/z/my-project/download/医藏/伤寒论集注.txt
- 行数:3674行
- 输出目录:/home/z/my-project/upload/1output/伤寒论集注/
Step 2: 关键词检索
rg -n '衣裳|衣冠|裘褐|短褐|布衣|冠服|弁|帻|巾帽|履|舄|鞋|靴|袜|绶|笏|袍|衫|袄|裙|裤|褐|襦|襟|袂|领衿|裾|帷幄|幔帐|旌旗|丝帛|绢|绸|缎|锦|绮|绫罗|纱帽|绡|缟|缯|绒|毡|葛布|苎麻|绵絮|服饰|簪钗|钿|珰|环钏|镯|珠玉|翠|金银|染色|黼黻|冕服|冠服|朝服|祭服|丧服|常服|公服|法服|戎服|便服|凶服|龙袍|蟒袍|补服|道袍|僧衣|袈裟|衣被|衣带|衣领|衣袖|薄衣|厚衣|解衣|更衣|着衣|被衣|穿衣|脱衣|衣衾'
Step 3: 命中结果
- 初次检索命中约20行
- 经甄别排除OCR讹误("袜"="铢"、"袂"="茯")与人名("主履"="王履")后,真正服饰相关仅3条
Step 4: 关键甄别
- 行2250:"生姜一两六袜"→应为"六铢",OCR将"铢"误识为"袜”
- 行3233:"袂等芍药"→应为"茯苓芍药",OCR将"茯"误识为"袂”
- 行1914:"主履"→疑为"王履"之误
Step 5: 输出文件
- 原文提取.md(约2.5KB)
- 总结.md(约2KB)
- 日志.md(本文件)
关键踩坑
- 本书OCR质量较差,"铢"→"袜"、"茯"→"袂"等讹误恰好落在服饰关键词上,极易造成误判
- “主履"为医家人名,非"履"(鞋)的服饰用法