《简明医彀》服饰内容提取日志
基本信息
- 输入文件:/home/z/my-project/download/part3/医藏/简明医彀.txt
- 输出目录:/home/z/my-project/upload/2output/简明医彀/
- 全书行数:10367行
- 提取日期:2026-03-05
搜索过程
第一轮:全量关键词搜索
- 关键词集:衣/裳/服/冠/帽/巾/履/鞋/裘/袍/袄/裙/裤/帛/绢/绸/缎/丝/麻/葛/绫/罗/纱/褐/毡/锦/绣/佩/带/褂/袜/衮/冕/弁/笏
- 匹配行数:607行
- 问题:大量匹配为药材名(麻黄、升麻、葛根等)、丸衣名(朱砂为衣、金箔为衣)、容器名(绢袋)等,噪音极高
第二轮:精准服饰词搜索
- 搜索词:冠/帽/巾/履/鞋/裘/袍/袄/裙/裤/褂/袜/衮/冕/弁/笏
- 有效命中:约15条,含帽(小帽/漆帽)、鞋(布鞋/麻鞋)、裙(裙边)、裤(裤裆)、衣冠、履等
- 噪音:"弁以嘉名"(序言用语)、"动履失常"(行走义)等已排除
第三轮:服饰用"衣"字专项搜索
- 搜索模式:衣[^服]|衣$|衣服|衣裳|衣衾|衣被|衣带|着衣|更衣|暖衣|旧衣|新衣|单衣|污衣|衣领|衣里|衣冠
- 有效命中约40条
- 噪音:朱砂为衣、金箔为衣(丸药包衣)约占一半,已过滤
第四轮:织物类搜索
- 搜索词:帛/绢/绸/缎/绫/罗/纱/褐/毡/锦/绣
- 有效命中约20条
- 噪音:锦纹(斑疹描述)、绢袋(制药工具)、稀绢(过滤用)等已标注为间接服饰信息
过滤噪音规则
| 噪音类型 |
示例 |
处理 |
| 药材名 |
麻黄、升麻、葛根、胡麻 |
排除 |
| 丸药包衣 |
朱砂为衣、金箔为衣、朱衣 |
排除 |
| 制药工具 |
绢袋盛药、稀绢滤汁 |
归入织物用途,非服饰 |
| 非服饰引申 |
弁以嘉名、动履失常 |
排除 |
| 药材别名 |
绵马、锦纹大黄 |
排除 |
| 胎衣/胞衣 |
胎衣、胞衣不下 |
排除(非服饰) |
最终收录统计
| 分类 |
条目数 |
| 婴幼儿服饰 |
8条 |
| 衣料与织物(医疗用) |
6条 |
| 服饰与疾病诊断 |
7条 |
| 民间服饰习俗与偏方 |
8条 |
| 衣物与养生保健 |
8条 |
| 合计 |
37条 |
注意事项
- 本书为医书,服饰内容均为医学语境下的附带信息
- “衣"字出现频率最高,但大多为"朱砂为衣"等丸药用语或"胞衣"等产科术语,与服饰无关
- 帛、绢、绵等织物多作为医疗工具(包扎、过滤、裹药),非穿戴用途
- 最具服饰研究价值的段落集中在儿科"着衣"条及"看囟"条中的小帽记载
- 全书无服饰制度、等级服饰、礼仪服饰等内容