研究总结 日志 原文

《薛氏医案》服饰内容提取——操作日志


一、操作流程

Step 1:创建输出目录

mkdir -p /home/z/my-project/upload/2output/薛氏医案

结果:成功创建。

Step 2:文件概览

wc -l 薛氏医案.txt

结果:19908行。

Step 3:第一轮grep——核心服饰词

grep -n '衣|裳|服|冠|帽|巾|履|鞋|裘|袍|袄|裙|裤|衿|袂|衮|冕|弁|笏' 薛氏医案.txt | head -200

命中行数:200行截断,实际命中远超200行。 噪音比例:极高。"服"字几乎全部为"服药""服法"义;"衣"多为"锦衣"(官署名);"巾"为"巾袜"等零星出现;"鞋"仅见"鞋底"2处。无"裘、袍、袄、裙、裤、衿、袂、衮、冕、弁、笏"的服饰义用法。

Step 4:第二轮grep——纺织材料词

grep -n '帛|绢|绸|缎|丝|麻|葛|缟|缣|绫|罗|纱|褐|毡|锦|绣' 薛氏医案.txt | head -200

噪音比例:极高。"麻"几乎全为"麻黄""天麻""麻木";"丝"多为"丝客""丝针";"葛"全为"葛根""葛花";"帛"有"软帛""帛裹"等医用织物用法。无"绢、绸、缎、缟、缣、绫、纱、褐、毡、绣"的服饰义用法。

Step 5:第三轮grep——配饰与制度词

grep -n '佩|带|氅|褂|袜|赐服|赐紫|赐绯|品色|舆服|章服|冠服|服色|丧服' 薛氏医案.txt | head -100

噪音比例:高。"带"几乎全为"带下"(妇科病名)、"带脉"(经络名);"佩"有"佩弦、佩韦、环佩、佩白玉、可佩之"等少量服饰义用法。无"氅、褂、赐服、赐紫、赐绯、品色、舆服、章服、冠服、服色、丧服"的用法。

Step 6:补充搜索——精准服饰词组

grep -n '锦衣|单衣|束带|衣裳|布衣|衣冠|衣中|着肉|帛裹|软帛|炙衣|缓带|脱衣|脱巾'
grep -n '佩弦|佩韦|环佩|佩白玉|缝囊|巾袜|靴袜|不为裳|不解衣|鞋底|裹脐|帛缠'

结果:精准锁定约20行含服饰实质内容的行号。

Step 7:上下文提取

对关键行号使用sed提取前后各5行上下文,共提取约15段。

sed -n '132,142p' 薛氏医案.txt    # 行137:单衣
sed -n '2032,2042p' 薛氏医案.txt  # 行2037:不为裳、不解衣
sed -n '8600,8610p' 薛氏医案.txt  # 行8605:佩弦、佩韦、环佩、佩白玉
sed -n '8673,8683p' 薛氏医案.txt  # 行8678:衣中带雄黄
sed -n '8873,8883p' 薛氏医案.txt  # 行8878:缓带、炙衣
sed -n '5152,5162p' 薛氏医案.txt  # 行5157:脱衣去靴袜、脱巾袜
...

Step 8:噪音过滤与逐条判断


二、关键发现

序号 行号 关键词 服饰类型 主题分类
1 36 锦衣 官署名(源自织物名) 锦衣卫官称
2 137 丝客、单衣 丝商、单层衣 丝帛实业/衣物
3 2037 不为裳、不解衣 衣裳 小儿衣裳寒暖
4 5157 脱衣去靴袜、脱巾袜 靴、袜、巾 日常衣物
5 7602 衣箱、衣裳 衣箱、衣裳 日常衣物
6 8605 佩弦、佩韦、环佩、佩白玉 弓弦、软韦、玉佩 胎教佩饰
7 8650 带雄黄 随身佩带物 转女为男方术
8 8651 缝囊盛带之、佩之 囊袋佩饰 转女为男方术
9 8678 衣中带之 衣内佩带 转女为男方术
10 8845 浣衣、厚其衣裳 衣裳 妊娠衣裳调摄
11 8878 缓带、炙衣 腰带、烤热的衣服 妊娠衣裳调摄
12 10020 衣裳宜厚 衣裳 产时衣裳
13 10156 鞋底 民间助产法
14 15837 解脱衣裳 衣裳 小儿衣裳
15 2019 软帛 丝帛织物 医用织物
16 9969 帛裹 丝帛织物 医用织物
17 5162 鞋底 民间疗法
18 846 丧礼 丧服制度(间接) 丧礼

三、审核结果


四、产出文件清单

文件名 说明
薛氏医案_总结.md 服饰内容结构化总结
薛氏医案_日志.md 本文件,操作日志
薛氏医案_原文提取.md 带行号的原始服饰匹配片段