《证治准绳》服饰内容提取日志
操作流程记录
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/2output/证治准绳
- 结果:目录创建成功
Step 2: 文件基本信息
- 文件路径:/home/z/my-project/download/part3/医藏/证治准绳.txt
- 文件编码:UTF-8(含CRLF行结束符)
- 总行数:34758行
- 总字符数:约219万
- 书名:《证治准绳》(明·王肯堂撰,明代大型医学全书)
Step 3: 多轮关键词搜索
第一轮:核心服饰词搜索
grep -n '衣|裳|服|冠|帽|巾|履|鞋|裘|袍|袄|裙|裤|衿|袂|衮|冕|弁|笏'
- 命中行数:9811行
- 分析:绝大多数为医学用语("服药""服法""丝针""行履"等),与服饰无关
- 有效服饰内容估计:约15行
第二轮:纺织材料词搜索
grep -n '帛|绢|绸|缎|丝|麻|葛|缟|缣|绫|罗|纱|褐|毡|锦|绣'
- 命中行数:3791行
- 分析:绝大多数为药名(葛根、丝瓜、升麻等)或药方用语,"绸""缎""缣""毡"命中0行
- 有效服饰材料内容:约5行(如"绯绢""帛""白练""生绢"等)
第三轮:配饰与制度词搜索
grep -n '佩|带|氅|褂|袜|赐服|赐紫|赐绯|品色|舆服|章服|冠服|服色|丧服'
- 命中行数:394行
- 分析:绝大多数"带"为"赤白带下""带脉"等医学用语,"氅""褂""赐服""赐紫""赐绯""品色""舆服""章服""冠服""服色""丧服"均命中0-1行且非服饰义
- 有效服饰制度内容:0行
第四轮:精确服饰用语搜索
针对衣物具体用语、穿衣动作、纺织品实物、婴幼儿服饰、具体衣物名、服饰制度等6大类分别搜索:
| 搜索类别 | 关键词示例 | 命中行数 | 有效行数 |
|---|---|---|---|
| 衣物具体用语 | 重衣/薄衣/故衣/衣裳/衣带/衣被 | 70 | ~10 |
| 穿衣动作 | 汗沾衣/染衣/着衣/换衣/易衣 | 13 | ~8 |
| 纺织品实物 | 绢袋/绯绢/白练/帛裹/生绢 | 115 | ~5 |
| 婴幼儿服饰 | 襁褓/防袍/裹脐/帏幙 | 14 | ~5 |
| 具体衣物 | 布衣/锦衣/罗衣等 | 6 | 0 |
| 服饰制度 | 冠服/丧服/朝服/赐服等 | 205 | 0 |
第五轮:补充搜索
| 搜索类别 | 关键词 | 命中行数 | 有效行数 |
|---|---|---|---|
| 衣被/衣服 | 衣被/衣服 | 53 | ~5 |
| 棉絮/绵衣 | 絮/绵/故絮/新绵 | 363 | ~3 |
| 白练 | 白练/练帛 | 1 | 1 |
| 颜色衣 | 绯/缁/皂/青衣 | 414 | ~2 |
| 冠带头巾 | 头巾/缚髻帛 | 3 | 3 |
Step 4: 上下文提取
对20个关键行号执行sed上下文提取(前后各3行),共提取20段上下文,确认服饰内容。
Step 5: 噪音过滤
- "服"字:9811行命中中,99%为"服药""服法""常服"等医学义,仅保留"衣服""衣被""孝服"等服饰义
- "衣"字:大部分为"汗沾衣""衣被""衣裳"等生活用语,少数有服饰义
- "丝"字:几乎全部为药名(丝茅、丝络等),无服饰材料义
- "带"字:几乎全部为"赤白带下""带脉"等医学用语,"衣带"2条保留
- "帛"字:多为"帛裹""帛覆"等治疗用语,"缚髻帛"1条保留
- "裙"字:44行全部为"鳖甲去裙"(鳖甲边缘),与服饰无关
- "袍"字:11行中多为"绿袍散"(药方名),"防袍"2条保留
- "衮/冕/弁/笏":2行均为"衮研"(研磨方法),与服饰无关
Step 6: 原文验证
对全部20条引用进行逐行验证,确认关键词均存在于原始TXT文件中,通过率100%。
关键发现
- 服饰内容极少:全书34758行中,有效服饰内容仅约20条,占比极低
- 无服饰制度:全书无冠服制度、品色衣制、丧服礼制等内容
- 主要内容类型:
- 医理论述中的衣物比喻(寒热穿衣、水肿与衣)
- 婴幼儿养护中的穿衣规范(襁褓、防袍、薄衣法)
- 外治法中的织物使用(绢裹、帛覆、白练裹脐)
- 民间习俗中的衣物(衣带入药、头巾入药、衣物烧毁消毒)
- 绯绢袋佩药避邪
- **"防袍"**为本书特色词汇,即婴幼儿尿布/襁褓,出现2次
- **"头巾即缚髻帛也"**为本书对头巾的明确定义
- **黄汗"染衣黄如檗汁"**为中医以衣物为诊断依据的典型例证
审核结果
- 全部20条引用已通过原文验证
- 无编造内容
- 噪音过滤充分,所有保留条目均含服饰实质内容
- 本书服饰内容确实极少,结论可靠