《万病回春》服饰内容提取 · 操作日志
时间:2026-04-20 任务ID:batch2-4 文件:/home/z/my-project/download/医藏/万病回春.txt(14365行) 输出目录:/home/z/my-project/upload/1output/万病回春/
操作流程
Step 1: 确认文件基本信息
wc -l 万病回春.txt → 14365行
mkdir -p 输出目录
Step 2: 多轮grep搜索(6轮+专项)
第1轮:衣服类关键词
grep -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|履|舄|鞋|靴|袜|带|绶|佩|笏|袍|衫|袄|裙|裤|褐|襦|襟|袖|袂|领|衿|裾|幅|帷|幄|幔|帐|旌|旆|旗"
命中193行。绝大多数为医学用语:
- “衣":丸剂包衣(朱砂为衣、金箔为衣30+条)、胎衣/胞衣(7条)、脱衣散(方名)、循衣摸床(3条)、弃衣而走(2条)等
- “冠":鸡冠花(药材)、鸡冠血(药材)
- “履":动履、步履(行走能力)
- “鞋":鞋底炙热(外治法5条)、草鞋(1条)
- “巾":手巾(2条)
- “袍":绿袍散(方名)
- “褐":炒褐色(炮制术语)、红褐炒灰(药材)
- “袖":袖手待毙(成语)、袖藏(诗句)
第2轮:纺织材料类关键词
grep -n "丝|帛|绢|绸|缎|锦|绮|绫|罗|纱|绡|缟|缯|纺|绒|毡|褐|麻|葛|苎|绵|絮"
命中453行。绝大多数为药材/医学术语:
- “丝":丝线缝合、丝脉(脉象)
- “帛":绢帛(医用敷料10+条)
- “锦":锦纹大黄(品种名)、锦帕(1条)
- “纱":绛纱囊(1条)
- “绵":绵纸(医用包装)、绵衣(2条)
- “麻":麻黄、麻仁等药材
第3轮:首饰装饰类关键词
grep -n "服|饰|妆|梳|簪|钗|钿|珰|环|钏|镯|珠|玉|翠|金|银"
命中1527行。几乎全为药材:
- 金箔、金银、珍珠、琥珀等均为制药材料
- “服"为"服药""服法"等
第4轮:颜色类关键词
grep -n "染|色|赤|青|黄|白|黑|玄|紫|绯|绿|赭"
命中2329行。全为医学望诊/药材内容。
第5轮:纹饰工艺类关键词
grep -n "绣|织|纹|章|黼|黻|文|画|饰"
命中40行。无纹饰内容。
第6轮:制度性服饰
grep -n "冕服|冠服|朝服|祭服|丧服|常服|公服|法服|戎服|便服|凶服|龙袍|蟒袍|补服|道袍|僧衣|袈裟"
命中0条。
专项搜索
grep -n "旧裙|旧袄|小儿衣|衣衫|丝绫罗毡绒|穿衣|棉袄|披麻|带孝|衣钵|黄汗|染衣|红褐"
命中关键条目:
- 第11351行:婴儿服饰宜忌(全书核心条目)
- 第5471行:棉袄与恶寒医案
- 第5545行:黄汗染衣
- 第14325行:衣冠以正为主
- 第14327行:披麻带孝
- 第14347行:解衣裘救寒士
Step 3: 逐条甄别
对全部grep命中项进行甄别,区分:
- ✅ 服饰本体内容(8条)
- ❌ 非服饰用法(30+条丸衣、7条胞衣、5条鞋底熨法、3条循衣摸床等)
Step 4: 撰写三份MD文档
关键发现
- 全书最核心服饰条目:第11351行,包含婴儿服饰形制(裙、袄、衣衫)、纺织材料(丝、绫、罗、毡、绒)、穿着禁忌三层信息
- **"XX为衣"**为全书最频繁的服饰词语用法(30+条),但全部是制药术语(丸剂包衣),与服饰无关
- 鞋底出现5次,均为以鞋底为加热工具的外治法(烘热熨患处),反映古代民间医疗器具匮乏时的替代做法
- 循衣摸床、弃衣而走、引衣蜷卧为中医经典危重病征描述,涉及服饰但非服饰本体内容
- 制度性服饰关键词(冕服、冠服、朝服等)零命中,符合医书性质
关键踩坑记录
- “脱衣散"初看似乎与脱衣相关,实为治疗"胞衣不下"(胎盘滞留)的方剂
- “混元衣"实为药材名(干燥胎盘),非衣物
- “红褐"初看为颜色名,实为旧红褐色布料入药(炒灰),但此为药用而非服饰
- “裘"在第3815行出现,但"土糖裘"指蜣螂滚的粪球,非皮衣
- “衣钵"为佛教传承之喻(第27行),非实际服饰
审核结果
✅ 全部通过
- 原文均从源文件grep提取,行号可验证
- 内容极少据实说明,未强行凑内容
- 非服饰用法逐条甄别标注