《小品方》服饰整理日志
任务信息
| 项目 | 内容 |
|---|---|
| 任务名称 | 服饰整理-小品方 |
| 源文件 | /home/z/my-project/download/part2_extracted/医藏/小品方.txt |
| 输出目录 | /home/z/my-project/upload/2output/小品方/ |
| 文件总行数 | 4221行 |
| 处理日期 | 2026-03-04 |
处理流程
第一步:文件概览
- 读取文件前100行,确认文本结构:卷次+方名+药方+主治
- 识别文体特征:南朝医学方书,以"服""治""方"为核心术语
- 初判:服饰信息将以"服"(服药)为大宗干扰项,需精细过滤
第二步:关键词搜索
第一轮搜索:使用grep -n搜索以下关键词:
衣|裳|冠|帽|履|带|袍|裙|衫|褐|裘|佩|襦|袴|裈|袂|襟|裾|绅|簪|钗|珥|钏|环|幘|弁|冕|绶|绮|罗|纱|绢|缣|帛|锦|绣|纩|丝|麻|葛布|布衣|朝服|丧服|戎服|道服|儒服|胡服|袈裟
结果:190行命中,但大量为"服药""服汤"等医学用法,需过滤。
第二轮搜索:排除"服药/服汤/服丸/温服/顿服/酒服/饮服/水服"等医学复合词,剩余66行。
第三轮搜索:进一步用复合词精准搜索:
衣裳|衣带|衣中|脱衣|着衣|衣被|衣温|布帛|帛裹|绢囊|锦纹|麻履|单衣|垢衣|新衣|散发|钗头|簪头|甑带|革带|系带|胞衣|月衣|污衣|履袜|袍|弩|鸡冠|毡|白布|故布|布巾
获得精准命中约50行。
第三步:上下文提取
对每一条命中行,使用sed -n提取完整行文,逐条阅读确认服饰含义,排除以下误命中:
- 锦纹:3处均作比喻(龙骨纹理、面赤斑、瘾疹),非实指织物
- 昆布:海藻类药材,非织物
- 布列:排列之意,非布料
- 散发:1处为"散发受风"(散开头发),属服饰行为;其余为"寒食散发"(药散发作),需辨析
- 鸡冠:2处均指鸡的冠部,非帽冠
- 弩:弩弦/弩箭为兵器,与衣带并列出现
第四步:分类整理
将49条有效服饰信息分为6大类:
- 衣物材质与织物(16条)
- 服饰类别与配件(9条)
- 穿着行为与调摄(12条)
- 妇产科衣物(8条)
- 民俗禁忌(2条)
- 急救中的衣物使用(3条)
第五步:撰写输出文件
| 文件 | 名称 | 内容 |
|---|---|---|
| 总结 | 小品方_服饰总结.md | 分类概述、词频统计、特征总结 |
| 日志 | 小品方_服饰整理日志.md | 本文件,处理流程记录 |
| 原文提取 | 小品方_服饰原文提取.md | 按类别辑录原文,附行号 |
遇到的问题与处理
| 问题 | 处理方式 |
|---|---|
| “服"字词频极高(服药/服汤等) | 排除所有医学用法的"服",仅保留"衣被""衣裳"等服饰义 |
| “衣"的多义性(胞衣vs衣物) | 胞衣条目单独归入妇产科类,并注明其文化意涵 |
| “散发"歧义(散发受风vs寒食散发) | 仅"散发受风"归入穿着行为,"散发"归入药散发作 |
| 锦纹为比喻用法 | 仍纳入织物类但注明非实指 |
| KT为OCR乱码 | 保留原样,注明"KT袍"疑为"襁袍"或"缏袍” |
| 布列/昆布等误命中 | 逐一排除 |
未搜索到的服饰类型
以下关键词在本书中无服饰义出现: 裳、冠(仅鸡冠)、帽、裙、衫、褐、裘、佩、襦、袴、裈、袂、襟、裾、绅、珥、钏、环、幘、弁、冕、绶、绮、罗、纱、缣、纩、朝服、丧服、戎服、道服、儒服、胡服、袈裟
这说明《小品方》作为实用方书,服饰信息极为有限,远不如礼书、史书、文学作品中丰富。