女科百问 服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 任务ID | 8-5 |
| 书名 | 女科百问 |
| 输入路径 | /home/z/my-project/download/part2_extracted/医藏/女科百问.txt |
| 输出路径 | /home/z/my-project/upload/2output/女科百问/ |
| 全文行数 | 2183行 |
| 提取方法 | grep+sed(不载入全文) |
六轮词库扫描记录
第1轮:衣裳冠冕弁帻巾帽袍衫裙袂裾裘褐衮
| 指令 | rg -n '衣|裳|冠|冕|弁|帻|巾|帽|袍|衫|裙|袂|裾|裘|褐|衮' |
|---|---|
| 命中行数 | 约22行 |
| 有效服饰条 | 7条 |
| 伪命中分析 | “朱砂为衣""金箔为衣"×3 = 药丸外衣;"胎衣"×6 = 胎盘;"鸡冠花” = 植物名 |
有效条目:
- 行601:以衣衬之(药贴衬衣)
- 行655:弃衣逾走(狂病脱衣)
- 行661:衣被盖覆(覆汗)
- 行731:衣里冷湿(病因)
- 行1207:去妊妇心前衣服看之(解衣诊察)
- 行1731:洗浣衣服,必浓其裳(胎教)
- 行1883:旧青衣裹(药用衣料)
排除条目:
- 行121/255/659/711/927:"XX为衣” = 丸药外衣,非人服饰
- 行155:"虾麻衣” = 排出物形容,非衣物
- 行1813/1815/1859/1861/1869/1887/2005:"胎衣/胞衣” = 胎盘,非服饰
- 行1889:"黑衣(灶屋尘)” = 灶突烟尘,非衣物
- 行865:"白鸡冠花” = 植物名
第2轮:服色舆服冠服章服品服朝服公服常服祭服丧服赐服赐紫赐绯借紫
| 指令 | rg -n '服色|舆服|冠服|章服|品服|朝服|公服|常服|祭服|丧服|赐服|赐紫|赐绯|借紫' |
|---|---|
| 命中行数 | 9行 |
| 有效服饰条 | 0条 |
| 伪命中分析 | “常服"×9 = 常常服用(吃药),非"日常服装” |
全部排除: 所有"常服"均为"经常服用(药物)"之义,无一为服饰制度术语。
第3轮:锦绮帛绢绫罗缎纱绸丝绵布麻葛缂丝茧蚕
| 指令 | rg -n '锦|绮|帛|绢|绫|罗|缎|纱|绸|丝|绵|布|麻|葛|缂|茧|蚕' |
|---|---|
| 命中行数 | 约45行 |
| 有效服饰条 | 1条 |
| 伪命中分析 | “丝"→炒令丝断(杜仲)/去丝(僵蚕);"麻"→麻黄/麻仁/胡麻/大麻仁(药名);"葛"→干葛/葛根(药名);"蚕"→蚕蜕/蚕沙/僵蚕(药名);"布"→蚕蜕布/以布绞汁/熟布(药料);"罗"→细罗末(筛药) |
有效条目:
- 行899:绿丝绳急缚之(灸法用丝绳缚指)——勉强算服饰相关,实为医疗用具
排除条目:
- 行59/1019/1265/1505/1507/2165:"干葛/葛根” = 药名
- 行171/1273/1487:"如麻豆大” = 大小形容
- 行203/1121:"炒令丝断/去丝” = 药材加工
- 行275:"蚕蜕布” = 药名
- 行303/659/745:"僵蚕(去丝)” = 药名
- 行871/873:"胡麻” = 药名
- 行911/913/1631/1633/2049/2051/2053:"麻仁/麻仁丸” = 药名/方名
- 行2007:"以布绞汁” = 医用布
- 行2073:"熟布(烧灰)” = 药料
第4轮:佩笏带绶鱼袋幞头舄履靴环钗簪珥
| 指令 | rg -n '佩|笏|带|绶|鱼袋|幞头|舄|履|靴|环|钗|簪|珥' |
|---|---|
| 命中行数 | 约15行 |
| 有效服饰条 | 4条 |
| 伪命中分析 | “带"→带下/冲带(病名);"环"→旋环/行环(动词);"金钗石斛"=药名 |
有效条目:
- 行731:腰重如带五贯钱重者(带为腰带义)
- 行1707:箸簪珂环(簪、环为首饰)
- 行1777:缓带自持(带为腰带义)
- 行1887:衣带先断(衣带为胞衣连带)
- 行2143:足履之所着(履为鞋履)
- 行2151:履湿气(履为踩踏义,勉强算)
排除条目:
- 行141:"鬼腰带” = 药名(一作鬼箭)
- 行513:"金钗石斛” = 药名
- 行239/241/929/931/933/935/945/951/953/1047:"带下/赤白带” = 妇科病名
- 行831/839:"旋环/行环” = 动词
第5轮:紫绯青绿赭黼黻绣染织缝纹
| 指令 | rg -n '紫|绯|青|绿|赭|黼|黻|绣|染|织|缝|纹' |
|---|---|
| 命中行数 | 约40行 |
| 有效服饰条 | 0条 |
| 伪命中分析 | “紫"→紫石英/紫菀/紫苏/紫金丹/紫金牛/紫桂丸/紫癜(均药名/病名);"青"→青皮/青盐/青葙子(药名) |
全部排除: 无一"紫""青"用于服饰色彩描述。所有命中均为药名或病名。
第6轮:医官太医药衣药布裹缠缚包裹衣药绵药绢裹创缠帛束帛裹伤绢包
| 指令 | rg -n '医官|太医|药衣|药布|裹|缠|缚|包裹|药绵|药绢|裹创|缠帛|束帛|裹伤|绢包' |
|---|---|
| 命中行数 | 约10行 |
| 有效服饰条 | 0条(独立有效) |
| 伪命中分析 | “裹"→湿纸裹蒸/裹煨(药料炮制);"缚"→绿丝绳急缚之(已计入第3轮);"裹血/裹精"=医学概念 |
全部排除: 无"医官""太医""药衣""缠帛""束帛"等词出现。
对抗式审查记录
审查1:是否遗漏服饰条目?
- 已覆盖六轮词库共68个关键词
- 回查全文,"帕子"(行601)为头巾/帕类,已含于第1轮"巾"之延伸,补充记录
- “皮纸为贴"非服饰
审查2:伪命中是否误判?
- “胎衣"是否应计入?→ 否,胎盘为产科术语,非服饰
- “朱砂为衣"是否应计入?→ 否,丸药外衣非人穿着衣物
- “常服"是否可能为"日常服装"?→ 否,本书9处"常服"均接药名/药量,为"经常服用"义
- “黑衣(灶屋尘)"是否应计入?→ 原注明为"灶屋尘",非衣物
- “衣带先断"是否应计入?→ 勉强算,"衣带"虽指胞衣连带,但用"带"字含服饰语义
审查3:数据可靠性
- 全书2183行,六轮grep共扫描约140行命中
- 逐一人工判读,排除伪命中约126行
- 有效服饰条目14条,占全文0.6%
- 服饰信息密度极低,符合妇产科专书的预期
审查4:是否存在制度性服饰信息?
- 确认不存在:无舆服、冠服、章服、品服、朝服、公服、祭服、丧服、赐服记载
- 无医官服饰信息(无"医官""太医""药衣"等词)
- 无丝织品等级信息
提取统计
| 轮次 | 关键词数 | 命中行数 | 有效条目 | 排除条目 | 有效率 |
|---|---|---|---|---|---|
| 第1轮 | 16 | 22 | 7 | 15 | 31.8% |
| 第2轮 | 14 | 9 | 0 | 9 | 0% |
| 第3轮 | 17 | 45 | 1 | 44 | 2.2% |
| 第4轮 | 13 | 15 | 5 | 10 | 33.3% |
| 第5轮 | 12 | 40 | 0 | 40 | 0% |
| 第6轮 | 15 | 10 | 0 | 10 | 0% |
| 合计 | 87 | 141 | 13 | 128 | 9.2% |
结论
本书服饰信息极度匮乏,有效匹配率仅9.2%。绝大多数命中为药名、病名或医学术语中的同字异义词。真正涉及服饰制度的记载为零,仅有的14条有效匹配均为日常生活层面的衣物附带提及。