研究总结 日志 原文

《外科全生集》服饰提取日志

任务ID:2-3

书名:外科全生集


步骤1:文件基本信息

wc -l /home/z/my-project/download/part2_extracted/医藏/外科全生集.txt
# 结果:2678行

步骤2:六轮grep检索

第1轮:核心服饰词(衣裳冠冕弁帻巾帽袍衫裙袂裾裘褐衮)

rg -n '衣|裳|冠|冕|弁|帻|巾|帽|袍|衫|裙|袂|裾|裘|褐|衮' 外科全生集.txt

命中行号及初步判定:

有效命中:3处

第2轮:制度等级词(服色舆服冠服章服品服朝服公服常服祭服丧服赐服赐紫赐绯借紫)

rg -n '服色|舆服|冠服|章服|品服|朝服|公服|常服|祭服|丧服|赐服|赐紫|赐绯|借紫' 外科全生集.txt

命中:0处

第3轮:织物材料词(锦绮帛绢绫罗缎纱绸丝绵布麻葛缂丝茧蚕)

rg -n '锦|绮|帛|绢|绫|罗|缎|纱|绸|丝|绵|布|麻|葛|缂丝|茧|蚕' 外科全生集.txt

命中极多(约80+条),但绝大部分为药名:

有效命中:4处(绢缚、绢绑缚、绸包、绢包)

第4轮:佩饰配件词(佩笏带绶鱼袋幞头舄履靴环钗簪珥)

rg -n '佩|笏|带|绶|鱼袋|幞头|舄|履|靴|环|钗|簪|珥' 外科全生集.txt

命中中"带"字极多(带皮、带脉等药名/病名),"环"字见于穴位名(环跳),均非服饰。

有效命中:1处

第5轮:颜色工艺词(紫绯青绿赭黼黻绣染织缝纹)

rg -n '紫|绯|青|绿|赭|黼|黻|绣|染|织|缝|纹' 外科全生集.txt

命中极多,但绝大部分为:

有效新增命中:0处

第6轮:医书特有服饰词(医官太医药衣药布裹缠缚包裹衣药绵药绢裹创缠帛束帛裹伤绢包)

rg -n '医官|太医|药衣|药布|裹|缠|缚|包|裹衣|药绵|药绢|裹创|缠帛|束帛|裹伤|绢包' 外科全生集.txt

命中极多,绝大部分为医疗操作:

有效新增命中:1处(缠足裹布)


步骤3:sed提取上下文

对以下关键行执行 sed -n 'N-2,N+2p' 提取上下文:

sed -n '284,288p' 外科全生集.txt   # 行286 衣遮
sed -n '362,366p' 外科全生集.txt   # 行364 裙风
sed -n '713,717p' 外科全生集.txt   # 行715 裹布
sed -n '278,282p' 外科全生集.txt   # 行280 绢缚
sed -n '884,888p' 外科全生集.txt   # 行886 绢绑缚
sed -n '644,648p' 外科全生集.txt   # 行646 丝线
sed -n '2366,2370p' 外科全生集.txt # 行2368 绸包
sed -n '2481,2485p' 外科全生集.txt # 行2483 绢包
sed -n '1778,1782p' 外科全生集.txt # 行1780 小儿衣
sed -n '1928,1932p' 外科全生集.txt # 行1930 沾衣
sed -n '308,312p' 外科全生集.txt   # 行310 为衣
sed -n '950,956p' 外科全生集.txt   # 行953 穿盖
sed -n '660,664p' 外科全生集.txt   # 行662 裹伤
sed -n '2160,2170p' 外科全生集.txt # 行2162-2168 金箔为衣
sed -n '626,630p' 外科全生集.txt   # 行628 舌硬生衣
sed -n '726,730p' 外科全生集.txt   # 行728 绢抹
sed -n '2384,2388p' 外科全生集.txt # 行2386 长发扎
sed -n '2638,2642p' 外科全生集.txt # 行2640 棉絮包

步骤4:汇总

六轮检索总结:


步骤5:对抗式审查

审查要点:

  1. “为衣""作衣"为药丸包衣工艺,已排除
  2. “舌硬生衣"为病证名,已排除
  3. “胞衣"为胎盘,已排除
  4. “裘氏本"为人名,已排除
  5. 麻黄、天麻等药名中"麻"字,已排除
  6. 绵茵陈药名中"绵"字,已排除
  7. 紫苏、紫花地丁等药名中"紫"字,已排除
  8. “绣球风"为病名,不含刺绣工艺,已排除
  9. “缠喉风"为病名,与缠足无关,已排除

步骤6:写三份MD

输出文件: