研究总结 日志 原文

《外台秘要方》服饰内容整理日志

整理时间:2026-03-04 文件路径:/home/z/my-project/download/part2_extracted/医藏/外台秘要方.txt 文件总行数:22501行


第一步:查看文件规模

wc -l /home/z/my-project/download/part2_extracted/医藏/外台秘要方.txt
# 结果:22501行(大型医书,绝不载入全文)

第二步:六轮grep搜索

第一轮:核心服饰词(衣、裳、冠、冕、弁、帻、巾、帽、袍、衫、裙、袂、裾、裘、褐、衮)

grep -n "衣\|裳\|冠\|冕\|弁\|帻\|巾\|帽\|袍\|衫\|裙\|袂\|裾\|裘\|褐\|衮" 外台秘要方.txt | head -200

匹配行数极多("衣"字出现频率极高),主要命中:

第二轮:制度等级词(服色、舆服、冠服、章服、品服、朝服、公服、常服、祭服、丧服、赐服、赐紫、赐绯、借紫)

grep -n "服色\|舆服\|冠服\|章服\|品服\|朝服\|公服\|常服\|祭服\|丧服\|赐服\|赐紫\|赐绯\|借紫" 外台秘要方.txt | head -100

结果:全部为"常服"(经常服用之意),无服饰制度相关内容。此轮无有效命中。

第三轮:织物材料词(锦、绮、帛、绢、绫、罗、缎、纱、绸、丝、绵、布、麻、葛、缂丝、茧、蚕)

grep -n "锦\|绮\|帛\|绢\|绫\|罗\|缎\|纱\|绸\|丝\|绵\|布\|麻\|葛\|缂丝\|茧\|蚕" 外台秘要方.txt | head -300

有效命中:

大量"绵裹"为药方包法,"布"多为裹药用,均非服饰内容。

第四轮:佩饰配件词(佩、笏、带、绶、鱼袋、幞头、舄、履、靴、环、钗、簪、珥)

grep -n "佩\|笏\|带\|绶\|鱼袋\|幞头\|舄\|履\|靴\|环\|钗\|簪\|珥" 外台秘要方.txt | head -200

有效命中:

“带"字绝大多数为"带下"(妇科病名),少量"衣带"有效。

第五轮:颜色工艺词(紫、绯、青、绿、赭、黼、黻、绣、染、织、缝、纹)

grep -n "紫\|绯\|青\|绿\|赭\|黼\|黻\|绣\|染\|织\|缝\|纹" 外台秘要方.txt | head -300

有效命中:

大量"紫"为紫菀、紫苏等药名,"青"为青木香等药名,"染"多在"黄汗染衣"中,需甄别。

第六轮:医书特有服饰词(医官、太医、药衣、药布、裹、缠、缚、包、裹衣、药绵、药绢、裹创、缠帛、束帛、裹伤、绢包)

grep -n "医官\|太医\|药衣\|药布\|裹\|缠\|缚\|包\|裹衣\|药绵\|药绢\|裹创\|缠帛\|束帛\|裹伤\|绢包" 外台秘要方.txt | head -300

有效命中:

“太医"均为医官名,非服饰内容。"裹""包"均为药物包扎法,非服饰。

第三步:sed提取关键片段

对筛选出的有效行号进行上下文提取(前后各3-5行),共提取约20段关键片段:

sed -n '900,910p' 外台秘要方.txt    # 衣香门目
sed -n '930,945p' 外台秘要方.txt    # 熏衣/裛衣香方标题
sed -n '17080,17120p' 外台秘要方.txt # 熏衣/裛衣香方详方
sed -n '17560,17590p' 外台秘要方.txt # 产妇五色衣法
sed -n '1968,1975p' 外台秘要方.txt   # 妇人衣服入药
sed -n '14635,14642p' 外台秘要方.txt # 白越布衫
sed -n '2747,2770p' 外台秘要方.txt   # 黄汗染衣
sed -n '15320,15335p' 外台秘要方.txt # 重裘不暖
sed -n '15388,15400p' 外台秘要方.txt # 衣麻布禁忌
sed -n '17245,17270p' 外台秘要方.txt # 妊娠衣裳法
sed -n '16460,16475p' 外台秘要方.txt # 衣香概述
sed -n '1188,1195p' 外台秘要方.txt   # 唐制腊日赐口脂面药
sed -n '8733,8740p' 外台秘要方.txt   # 衣缨士人
sed -n '16109,16118p' 外台秘要方.txt # 整衣冠仪式
sed -n '17691,17698p' 外台秘要方.txt # 夫衣带助产
sed -n '17866,17873p' 外台秘要方.txt # 衣带临产
sed -n '6828,6838p' 外台秘要方.txt   # 绯绢袋

第四步:对抗式审查

排除以下误匹配:

  1. “胞衣"(胎盘)→ 非服饰,排除
  2. “衣中白鱼"(衣鱼虫)→ 非服饰,排除
  3. “地衣草""墙衣""瓦衣""炉上青衣""铁上生衣"(地衣/锈蚀)→ 非服饰,排除
  4. “驴驹衣"(驴胎衣)→ 非服饰,排除
  5. “麴衣""黄衣在胃中"(霉菌/病理术语)→ 非服饰,排除
  6. “绵裹"(药方包法,出现数百次)→ 非服饰,排除
  7. “常服"(经常服用)→ 非服饰制度,排除
  8. “带下"(妇科病名,出现数十次)→ 非佩饰,排除
  9. “紫菀""紫苏""青木香"等药名→ 非颜色词,排除
  10. “衣被""衣裳"作被褥泛称→ 多数非服饰制度,仅保留有制度意义者

第五步:撰写三份MD文件