研究总结 日志 原文

《小品方》服饰整理日志

任务信息

项目 内容
任务名称 服饰整理-小品方
源文件 /home/z/my-project/download/part2_extracted/医藏/小品方.txt
输出目录 /home/z/my-project/upload/2output/小品方/
文件总行数 4221行
处理日期 2026-03-04

处理流程

第一步:文件概览

第二步:关键词搜索

第一轮搜索:使用grep -n搜索以下关键词:

衣|裳|冠|帽|履|带|袍|裙|衫|褐|裘|佩|襦|袴|裈|袂|襟|裾|绅|簪|钗|珥|钏|环|幘|弁|冕|绶|绮|罗|纱|绢|缣|帛|锦|绣|纩|丝|麻|葛布|布衣|朝服|丧服|戎服|道服|儒服|胡服|袈裟

结果:190行命中,但大量为"服药""服汤"等医学用法,需过滤。

第二轮搜索:排除"服药/服汤/服丸/温服/顿服/酒服/饮服/水服"等医学复合词,剩余66行。

第三轮搜索:进一步用复合词精准搜索:

衣裳|衣带|衣中|脱衣|着衣|衣被|衣温|布帛|帛裹|绢囊|锦纹|麻履|单衣|垢衣|新衣|散发|钗头|簪头|甑带|革带|系带|胞衣|月衣|污衣|履袜|袍|弩|鸡冠|毡|白布|故布|布巾

获得精准命中约50行。

第三步:上下文提取

对每一条命中行,使用sed -n提取完整行文,逐条阅读确认服饰含义,排除以下误命中:

第四步:分类整理

将49条有效服饰信息分为6大类:

  1. 衣物材质与织物(16条)
  2. 服饰类别与配件(9条)
  3. 穿着行为与调摄(12条)
  4. 妇产科衣物(8条)
  5. 民俗禁忌(2条)
  6. 急救中的衣物使用(3条)

第五步:撰写输出文件

文件 名称 内容
总结 小品方_服饰总结.md 分类概述、词频统计、特征总结
日志 小品方_服饰整理日志.md 本文件,处理流程记录
原文提取 小品方_服饰原文提取.md 按类别辑录原文,附行号

遇到的问题与处理

问题 处理方式
“服"字词频极高(服药/服汤等) 排除所有医学用法的"服",仅保留"衣被""衣裳"等服饰义
“衣"的多义性(胞衣vs衣物) 胞衣条目单独归入妇产科类,并注明其文化意涵
“散发"歧义(散发受风vs寒食散发) 仅"散发受风"归入穿着行为,"散发"归入药散发作
锦纹为比喻用法 仍纳入织物类但注明非实指
KT为OCR乱码 保留原样,注明"KT袍"疑为"襁袍"或"缏袍”
布列/昆布等误命中 逐一排除

未搜索到的服饰类型

以下关键词在本书中服饰义出现: 裳、冠(仅鸡冠)、帽、裙、衫、褐、裘、佩、襦、袴、裈、袂、襟、裾、绅、珥、钏、环、幘、弁、冕、绶、绮、罗、纱、缣、纩、朝服、丧服、戎服、道服、儒服、胡服、袈裟

这说明《小品方》作为实用方书,服饰信息极为有限,远不如礼书、史书、文学作品中丰富。