《医学实在易》服饰内容提取 · 日志
时间:2026-04-22 任务:提取医学藏第161本服饰相关内容
操作流程
Step 1: 创建目录
mkdir -p /home/z/my-project/upload/1output/医学实在易/
Step 2: 统计行数
wc -l 医学实在易.txt → 2883行
Step 3: 关键词检索
rg -n '衣裳|裘|冠|履|靴|袜|袍|衫|袄|裙|褐|袖|丝|帛|绢|绸|锦|绫|罗|纱|麻|葛|绵|絮|簪|钗|绣|织|巾|帻|帷|帐|旌|旗|袈裟|丧服|常服|公服' 医学实在易.txt
→ 初次检索返回大量结果(含医学术语误匹配)
Step 4: 精确筛选
对初筛结果逐条甄别,排除:
- “丝"→"丝络""蛛丝""如丝"(经脉描述,非丝织品)
- “锦"→"锦囊"(比喻用法,非锦缎实物)
- “冠"→"鸡冠""鸡冠疮"(药物/病名,非冠帽)
- “巾"→大部分为"巾"在病名或方名中
- “衣被"→仅一处为实际衣物用法
Step 5: 上下文提取
对6处有效匹配行提取上下文(±5行):
- 行549(绢袋盛药)
- 行937(揭衣被)
- 行1463(汗沾衣)
- 行1565(绢滤药汁)
- 行1591(棉絮白布复巾)
- 行1915(绢袋盛硝)
Step 6: 保存三份文件
- 原文提取.md(2,146字)
- 总结.md(1,328字)
- 日志.md(本文件)
关键发现
全书服饰内容极少,仅6处涉及织物/衣物的功能性使用,无服饰制度或纺织工艺论述。
踩坑记录
- 医学古籍中"丝""锦""冠""巾"等字频繁出现但多为医学比喻或病名,需逐条甄别
- “鸡冠"在医书中指药物形态或病名(鸡冠疮),非冠帽