《仁术便览》服饰内容提取 · 操作日志
时间:2026-04-19 任务:提取《仁术便览》全部服饰相关内容
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/1output/仁术便览
Step 2: 查询全书行数
wc -l 仁术便览.txt → 9947行
Step 3: 关键词grep检索
rg -n '衣裳|衣裘|冠冕|弁|帻|巾帽|履|舄|鞋|靴|袜|绶|笏|袍|衫|袄|裙|裤|褐|襦|襟|袖|袂|衿|裾|帷|幄|幔|帐|旌|旆|丝帛|绢|绸|缎|锦|绮|绫罗|纱|绡|缟|缯|绒|毡|葛布|苎|絮|簪|钗|钿|珰|钏|镯|翠|金银|染色|赤青|玄紫|绯|赭|黼|黻|龙袍|蟒袍|道袍|僧衣|袈裟|丧服|常服|朝服|祭服|戎服' 仁术便览.txt
返回大量匹配行,但绝大多数为医学词汇(金银花、黄连、黄芩等药名,锦纹大黄等药材描述,常服=经常服药等)。
Step 4: 精筛
排除所有明显非服饰用法后,逐一审核每条匹配:
- 排除:金银花(药名)、锦纹大黄(药材品级)、常服(经常服用)、丝(药材如杜仲炒断丝)、裙(龟板去裙=龟甲边缘)、絮(绵絮裹珍珠=药用包裹)、衣鱼(虫名)
- 保留:真正涉及衣物穿着、纺织品用途、衣物入药的条目
Step 5: 提取上下文
对保留条目用sed提取前后行,确认语境。
Step 6: 分类整理
归为三类:衣被与病症、纺织品医用、衣物入药。
甄别记录
| 关键词匹配 | 行号 | 判定 | 理由 |
|---|---|---|---|
| 旌 | 13 | ❌排除 | “旌干所及"=旌旗,非服饰主体 |
| 常服 | 119/193/2589等 | ❌排除 | “常服"="经常服用",非常服(日常服装) |
| 履 | 201/333 | ❌排除 | “不能动履"="不能行走",非鞋履 |
| 锦纹 | 1169/9209/9633 | ❌排除 | “如蚊虫形状而非锦纹也"=疹非锦纹;"锦纹大黄"=药材品级 |
| 絮 | 2339 | ❌排除 | “为穣絮绒长"=艾绒描述,非棉絮服饰 |
| 绯绢 | 7085 | ✅保留 | “用绯绢摊贴之"=绯色绢帛做膏药载体 |
| 衣裳 | 6669 | ✅保留 | “身穿稍浓衣裳"=穿厚衣裳,真实服饰用法 |
| 绢 | 6119/6533/7467/7513/8131/8429/8513/9175 | ⚠️部分保留 | 多数为"绢袋""绢帛"作医疗辅料;"熟绢衣角"保留 |
| 苎 | 7959/8465 | ❌排除 | “苎根""苎麻根"=药名 |
| 绵衣 | 2459 | ✅保留 | “以绵衣缚定"=绵衣固定敷药 |
| 衣 | 589/613/7177/8659/8975/8979 | ⚠️部分保留 | “衣鱼"=虫名排除;"引衣自盖""手寻衣领""解衣带""汗衣"保留 |
| 裙 | 8519/9901/9903 | ❌排除 | “尿存胞裙之内"=尿布概念;"龟板去裙""鳖甲去裙"=甲壳边缘 |
| 金银花 | 6491/7015/7037等数十处 | ❌排除 | 中药名 |
| 帛 | 6119/6323/7085/9083 | ⚠️部分保留 | “软帛拭干"=普通擦布;"以帛缚之""以帛扎定"保留 |
| 带 | 8975 | ✅保留 | “速解衣带” |
| 领 | 8659 | ✅保留 | “手寻衣领乱捻物” |
关键发现
- 本书为方剂书,服饰内容极其稀少,全书9947行仅约10条真实服饰相关内容
- "衣"字高频出现但几乎全为医学用法:朱砂为衣(药丸包衣)、更衣(通便)、衣被盖之(发汗护理)
- 纺织品(绢、帛、绵、布)在医疗中广泛使用,但功能为辅料而非服饰
- 唯一民俗色彩条目:旧汗衣烧灰入药,男用妇衣、妇用男衣,反映古代衣物与人身气场的巫术关联
审核结果
全部通过 ✅ — 原文均从grep检索+sed上下文提取,有明确行号对应,无非服饰条目误入。