理学类编

《理学类编》服饰提取日志

一、基本信息

项目 内容
书名 理学类编
文件路径 /home/z/my-project/upload/语录/理学类编.txt
总行数 527行
文件编码 UTF-8
输出目录 /home/z/my-project/upload/语录output/理学类编/

二、五轮grep统计

第1轮:关键词「衣裳冠冕服袍裘」

指标 数值
匹配行数 10行
匹配行号 273, 314, 330, 362, 484, 485, 487, 491, 499, 501
有效片段 8条
噪声行 2条(第487行"服食"为服药,第485行"服"属有效但需结合语境)

第2轮:关键词「佩弁帻笏舄履带旒簪钗钏巾帽」

指标 数值
匹配行数 7行
匹配行号 84, 109, 147, 314, 357, 372, 483
有效片段 2条(第314行"旒",第483行"头巾")
噪声行 5条(第84行"履"=践踏,第109行"脐带",第147行"带"=黄道带,第357行"履"=践踏,第372行"践履"=实践)

第3轮:关键词「帛锦绫罗缎绸绢丝纱葛麻布褐纩絺」

指标 数值
匹配行数 12行
匹配行号 4, 90, 169, 197, 225, 317, 351, 362, 468, 483, 491, 496/502
有效片段 4条(第317行"币帛",第362行"桑麻",第483行"布线",第491行"夏葛")
噪声行 8条(第4行"精蜜"中字,第90行"络丝"=天文,第169行"罗睺"=星名,第197行"班布"=分布,第225行"红纱"=比喻,第351行"羽毛"=动物,第468行"剃发"=剃头,第502行"翕聚"中字)

第4轮:关键词「深衣章服冠服舆服丧服祭服赐服品色朝服衮黼黻」

指标 数值
匹配行数 4行
匹配行号 67, 68, 201, 332
有效片段 0条
噪声行 4条("衮"均为"衮衮/衮来/衮一番",意为滚动,非衮服)

第5轮:关键词「织染裁缝文绣绣旌旗裙靴袜囊伞」

指标 数值
匹配行数 2行
匹配行号 403, 484
有效片段 0条
噪声行 2条(第403行"染"为比喻"未染只是白",第484行"粗衣"已入第1轮)

五轮汇总

轮次 匹配行 有效 噪声 有效率
第1轮 10 8 2 80%
第2轮 7 2 5 28.6%
第3轮 12 4 8 33.3%
第4轮 4 0 4 0%
第5轮 2 0 2 0%
合计 35 14(去重后11) 21 31.4%

三、去噪说明

噪声类型分析

噪声类型 数量 典型示例
同形异义(服≠服饰) 2 第487行"服食"=服药;第485行"易服"有效但含非服饰义项
同形异义(履≠鞋履) 2 第84行"履乎天末"=踏,第357行"足方履地"=踩
同形异义(带≠衣带) 2 第109行"脐带",第147行"斜带黄道"
同形异义(衮≠衮服) 4 第67/68/201/332行,"衮衮"=滚动
同形异义(染≠染色) 1 第403行"未染"=比喻本性纯洁
天文术语借词 3 第90行"络丝",第169行"罗睺",第147行"黄道带"
比喻用法 2 第225行"红纱"形容彩虹,第197行"班布"=分布
动物身体部分 1 第351行"羽毛"=鸟兽之毛
重复已计入 2 第484行"粗衣"已入第1轮,第483行"布线"非服饰

去噪规则

  1. "服"字:仅保留"盛服""易服""吉服""五服"等服饰义项,排除"服食"(服药)、"服牛"(驯服)等
  2. "履"字:仅保留作为鞋履的用法,排除"履地"(踏地)、"践履"(实践)
  3. "带"字:仅保留衣带义项,排除"脐带""黄道带"
  4. "衮"字:全部为"衮衮"(滚动),非衮服,全部排除
  5. "染"字:仅保留染色工艺义项,排除比喻用法
  6. 天文术语:罗睺、黄道带、络丝等虽含关键词但与服饰无关,全部排除

四、有效片段表

序号 行号 卷次 关键词 分类 内容摘要
1 273 卷五·鬼神 盛服 A.祭祀服饰 齐明盛服以承祭祀
2 314 卷五·鬼神 旒、冕、衣裳 A.祭祀服饰 垂旒端冕衣裳而坐
3 317 卷五·鬼神 A.祭祀服饰 废币帛而用楮泉
4 499 卷八·异端 吉服 B.丧服礼制 吉服不送其亲
5 501 卷八·异端 五服 B.丧服礼制 五服年月勅
6 362 卷六·人物 桑、麻 C.服饰材料 桑麻以衣之
7 491 卷八·异端 葛、裘 C.服饰材料 夏葛而冬裘
8 484 卷八·异端 粗衣 D.佛教与服饰 粗衣蔬食
9 485 卷八·异端 易服 D.佛教与服饰 易服以逃租赋
10 330 卷六·人物 新衣 E.日常服饰与气化论 新衣服生虮虱
11 483 卷八·异端 头巾 E.日常服饰与气化论 裹头巾验佛灯

五、审核结论

数据质量评估

提取可靠性

  1. 所有11条有效片段均经过原文对照核实,关键词在上下文中确属服饰义项
  2. 噪声排除标准一致,同形异义词均附排除理由
  3. 第4轮"衮"字4次出现均为"衮衮"(滚动),已全部正确排除
  4. 第2轮"履"字出现频次高但无一为鞋履义,反映理学文本中"履"多作动词使用的特点

学术审查意见