研究总结 日志 原文

女科百问 服饰提取日志

基本信息

项目 内容
任务ID 8-5
书名 女科百问
输入路径 /home/z/my-project/download/part2_extracted/医藏/女科百问.txt
输出路径 /home/z/my-project/upload/2output/女科百问/
全文行数 2183行
提取方法 grep+sed(不载入全文)

六轮词库扫描记录

第1轮:衣裳冠冕弁帻巾帽袍衫裙袂裾裘褐衮

指令 rg -n '衣|裳|冠|冕|弁|帻|巾|帽|袍|衫|裙|袂|裾|裘|褐|衮'
命中行数 约22行
有效服饰条 7条
伪命中分析 “朱砂为衣""金箔为衣"×3 = 药丸外衣;"胎衣"×6 = 胎盘;"鸡冠花” = 植物名

有效条目:

  1. 行601:以衣衬之(药贴衬衣)
  2. 行655:弃衣逾走(狂病脱衣)
  3. 行661:衣被盖覆(覆汗)
  4. 行731:衣里冷湿(病因)
  5. 行1207:去妊妇心前衣服看之(解衣诊察)
  6. 行1731:洗浣衣服,必浓其裳(胎教)
  7. 行1883:旧青衣裹(药用衣料)

排除条目:

第2轮:服色舆服冠服章服品服朝服公服常服祭服丧服赐服赐紫赐绯借紫

指令 rg -n '服色|舆服|冠服|章服|品服|朝服|公服|常服|祭服|丧服|赐服|赐紫|赐绯|借紫'
命中行数 9行
有效服饰条 0条
伪命中分析 “常服"×9 = 常常服用(吃药),非"日常服装”

全部排除: 所有"常服"均为"经常服用(药物)"之义,无一为服饰制度术语。

第3轮:锦绮帛绢绫罗缎纱绸丝绵布麻葛缂丝茧蚕

指令 rg -n '锦|绮|帛|绢|绫|罗|缎|纱|绸|丝|绵|布|麻|葛|缂|茧|蚕'
命中行数 约45行
有效服饰条 1条
伪命中分析 “丝"→炒令丝断(杜仲)/去丝(僵蚕);"麻"→麻黄/麻仁/胡麻/大麻仁(药名);"葛"→干葛/葛根(药名);"蚕"→蚕蜕/蚕沙/僵蚕(药名);"布"→蚕蜕布/以布绞汁/熟布(药料);"罗"→细罗末(筛药)

有效条目:

  1. 行899:绿丝绳急缚之(灸法用丝绳缚指)——勉强算服饰相关,实为医疗用具

排除条目:

第4轮:佩笏带绶鱼袋幞头舄履靴环钗簪珥

指令 rg -n '佩|笏|带|绶|鱼袋|幞头|舄|履|靴|环|钗|簪|珥'
命中行数 约15行
有效服饰条 4条
伪命中分析 “带"→带下/冲带(病名);"环"→旋环/行环(动词);"金钗石斛"=药名

有效条目:

  1. 行731:腰重如带五贯钱重者(带为腰带义)
  2. 行1707:箸簪珂环(簪、环为首饰)
  3. 行1777:缓带自持(带为腰带义)
  4. 行1887:衣带先断(衣带为胞衣连带)
  5. 行2143:足履之所着(履为鞋履)
  6. 行2151:履湿气(履为踩踏义,勉强算)

排除条目:

第5轮:紫绯青绿赭黼黻绣染织缝纹

指令 rg -n '紫|绯|青|绿|赭|黼|黻|绣|染|织|缝|纹'
命中行数 约40行
有效服饰条 0条
伪命中分析 “紫"→紫石英/紫菀/紫苏/紫金丹/紫金牛/紫桂丸/紫癜(均药名/病名);"青"→青皮/青盐/青葙子(药名)

全部排除: 无一"紫""青"用于服饰色彩描述。所有命中均为药名或病名。

第6轮:医官太医药衣药布裹缠缚包裹衣药绵药绢裹创缠帛束帛裹伤绢包

指令 rg -n '医官|太医|药衣|药布|裹|缠|缚|包裹|药绵|药绢|裹创|缠帛|束帛|裹伤|绢包'
命中行数 约10行
有效服饰条 0条(独立有效)
伪命中分析 “裹"→湿纸裹蒸/裹煨(药料炮制);"缚"→绿丝绳急缚之(已计入第3轮);"裹血/裹精"=医学概念

全部排除: 无"医官""太医""药衣""缠帛""束帛"等词出现。

对抗式审查记录

审查1:是否遗漏服饰条目?

审查2:伪命中是否误判?

审查3:数据可靠性

审查4:是否存在制度性服饰信息?

提取统计

轮次 关键词数 命中行数 有效条目 排除条目 有效率
第1轮 16 22 7 15 31.8%
第2轮 14 9 0 9 0%
第3轮 17 45 1 44 2.2%
第4轮 13 15 5 10 33.3%
第5轮 12 40 0 40 0%
第6轮 15 10 0 10 0%
合计 87 141 13 128 9.2%

结论

本书服饰信息极度匮乏,有效匹配率仅9.2%。绝大多数命中为药名、病名或医学术语中的同字异义词。真正涉及服饰制度的记载为零,仅有的14条有效匹配均为日常生活层面的衣物附带提及。