研究总结 日志 原文

奇效良方 — 服饰提取日志

任务信息

项目 内容
任务ID 6-5
书名 奇效良方
输入路径 /home/z/my-project/download/part2_extracted/医藏/奇效良方.txt
输出路径 /home/z/my-project/upload/2output/奇效良方/
文件规模 52045行 / 2,685,305字节
执行时间 2025年

六轮提取过程

第一轮:基础服饰词(衣裳冠冕弁帻巾帽袍衫裙袂裾裘褐衮)

指标 数据
初始匹配行数 56行
假阳性 裙→鳖甲去裙(龟甲"裙边",非衣裙);衮→衮药(混合,非衮服);巾→手巾(非冠巾)
有效条目 约10条
修正策略 增加上下文限定词(衣冠/衣被/衣服/衣带/襁褓/振袂)

第二轮:制度服饰词(服色舆服冠服章服品服朝服公服常服祭服丧服赐紫赐绯借紫)

指标 数据
初始匹配行数 108行
假阳性 常服→"常服此药"(经常服用,非常服制度);紫→紫菀/紫苏等药名
有效条目 1条(服色,亦非制度用法)
修正策略 常服/紫/青等词需排除药名语境

第三轮:织物原料词(锦绮帛绢绫罗缎纱绸丝绵布麻葛缂丝茧蚕)

指标 数据
初始匹配行数 1407行
假阳性率 极高(>90%)
主要假阳性 绢→生绢袋盛药(浸泡);绵→绵裹(含服);帛→帛试干(擦拭);麻→麻黄(药名);葛→葛根(药名);蚕→蚕砂/白僵蚕(药名)
有效条目 约20条(绯绢/青绢辟邪、锦灰入方、帛缠缚包扎等)
修正策略 排除"生绢袋盛"浸泡类、麻黄/葛根药名类、蚕砂药名类

第四轮:佩饰词(佩笏带绶鱼袋幞头舄履靴环钗簪珥)

指标 数据
初始匹配行数 162行
假阳性 带→腰带/带下/地带(多义);环→环境/环唇;佩→佩带/佩兰(药名)
有效条目 约5条(银钗、牙笏、履靴、金钗石斛)

第五轮:颜色纹饰词(紫绯青绿赭黼黻绣染织缝纹)

指标 数据
初始匹配行数 1310行
假阳性率 极高(>95%)
主要假阳性 紫→紫菀/紫苏/紫石英/紫金丹;青→青皮/青黛/青蒿/青盐;绿→绿豆/绿矾;绣→非服饰绣纹;缝→缝合猪肚/缝口
有效条目 约5条(绯绢/绯帛、银钗、汗染衣色)
修正策略 排除所有含药名前缀的紫/青/绿

第六轮:医事服饰词(医官太医药衣药布裹缠缚包裹药绵药绢裹创缠帛束帛裹伤绢包)

指标 数据
初始匹配行数 37行
假阳性 缚→缚定/扎缚/封缚(多为扎口/封口操作)
有效条目 约10条(医官、帛缠缚、绢帛缚定、布帛缚住等)

对抗式审查

审查1:去假阳性

类别 排除数 典型案例
鳖甲去裙 25条 裙=龟甲裙边,非衣裙
衮药/相衮 3条 衮=混合搅拌,非衮服
常服此药 60+条 常服=经常服用,非常服制度
麻黄/葛根 300+条 麻/葛=药名,非布料
生绢袋盛 30+条 绢=药袋材质,非穿着
金箔为衣 81条 为衣=丸药包衣,非穿衣
紫/青药名 800+条 紫/青=药名前缀

审查2:补遗漏

补充词 发现条目
襁褓 3条(小儿包裹衣)
振袂 1条(衣袖典故)
头巾垢 1条(巾帽入药)
跣足 2条(赤足与履)
汗出染衣 2条(诊断征象)
锦灰/锦片 3条(贵重织物入药)

审查3:交叉验证

最终统计

类别 条目数
日常穿着/病因 12
衣被覆汗疗法 11
小儿衣饰 8
辟邪系臂佩药 5
织物包扎敷药 10
头巾首饰入药 5
履靴足病 4
汗染衣色诊断 2
医官官职 1
合计 约58条

输出文件

文件名 说明
奇效良方_原文提取.md 按主题分类的原文条目
奇效良方_总结.md 服饰信息分析与总结
奇效良方_日志.md 本文件,提取过程记录

日志完毕。六轮提取+三轮对抗审查,确保提取质量。