研究总结 日志 原文

《证治准绳》服饰内容提取日志

操作流程记录

Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/2output/证治准绳

Step 2: 文件基本信息

Step 3: 多轮关键词搜索

第一轮:核心服饰词搜索

grep -n '衣|裳|服|冠|帽|巾|履|鞋|裘|袍|袄|裙|裤|衿|袂|衮|冕|弁|笏'

第二轮:纺织材料词搜索

grep -n '帛|绢|绸|缎|丝|麻|葛|缟|缣|绫|罗|纱|褐|毡|锦|绣'

第三轮:配饰与制度词搜索

grep -n '佩|带|氅|褂|袜|赐服|赐紫|赐绯|品色|舆服|章服|冠服|服色|丧服'

第四轮:精确服饰用语搜索

针对衣物具体用语、穿衣动作、纺织品实物、婴幼儿服饰、具体衣物名、服饰制度等6大类分别搜索:

搜索类别 关键词示例 命中行数 有效行数
衣物具体用语 重衣/薄衣/故衣/衣裳/衣带/衣被 70 ~10
穿衣动作 汗沾衣/染衣/着衣/换衣/易衣 13 ~8
纺织品实物 绢袋/绯绢/白练/帛裹/生绢 115 ~5
婴幼儿服饰 襁褓/防袍/裹脐/帏幙 14 ~5
具体衣物 布衣/锦衣/罗衣等 6 0
服饰制度 冠服/丧服/朝服/赐服等 205 0

第五轮:补充搜索

搜索类别 关键词 命中行数 有效行数
衣被/衣服 衣被/衣服 53 ~5
棉絮/绵衣 絮/绵/故絮/新绵 363 ~3
白练 白练/练帛 1 1
颜色衣 绯/缁/皂/青衣 414 ~2
冠带头巾 头巾/缚髻帛 3 3

Step 4: 上下文提取

对20个关键行号执行sed上下文提取(前后各3行),共提取20段上下文,确认服饰内容。

Step 5: 噪音过滤

Step 6: 原文验证

对全部20条引用进行逐行验证,确认关键词均存在于原始TXT文件中,通过率100%。


关键发现

  1. 服饰内容极少:全书34758行中,有效服饰内容仅约20条,占比极低
  2. 无服饰制度:全书无冠服制度、品色衣制、丧服礼制等内容
  3. 主要内容类型
    • 医理论述中的衣物比喻(寒热穿衣、水肿与衣)
    • 婴幼儿养护中的穿衣规范(襁褓、防袍、薄衣法)
    • 外治法中的织物使用(绢裹、帛覆、白练裹脐)
    • 民间习俗中的衣物(衣带入药、头巾入药、衣物烧毁消毒)
    • 绯绢袋佩药避邪
  4. **"防袍"**为本书特色词汇,即婴幼儿尿布/襁褓,出现2次
  5. **"头巾即缚髻帛也"**为本书对头巾的明确定义
  6. **黄汗"染衣黄如檗汁"**为中医以衣物为诊断依据的典型例证

审核结果