理学类编
《理学类编》服饰提取日志
一、基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 理学类编 |
| 文件路径 | /home/z/my-project/upload/语录/理学类编.txt |
| 总行数 | 527行 |
| 文件编码 | UTF-8 |
| 输出目录 | /home/z/my-project/upload/语录output/理学类编/ |
二、五轮grep统计
第1轮:关键词「衣裳冠冕服袍裘」
| 指标 | 数值 |
|---|---|
| 匹配行数 | 10行 |
| 匹配行号 | 273, 314, 330, 362, 484, 485, 487, 491, 499, 501 |
| 有效片段 | 8条 |
| 噪声行 | 2条(第487行"服食"为服药,第485行"服"属有效但需结合语境) |
第2轮:关键词「佩弁帻笏舄履带旒簪钗钏巾帽」
| 指标 | 数值 |
|---|---|
| 匹配行数 | 7行 |
| 匹配行号 | 84, 109, 147, 314, 357, 372, 483 |
| 有效片段 | 2条(第314行"旒",第483行"头巾") |
| 噪声行 | 5条(第84行"履"=践踏,第109行"脐带",第147行"带"=黄道带,第357行"履"=践踏,第372行"践履"=实践) |
第3轮:关键词「帛锦绫罗缎绸绢丝纱葛麻布褐纩絺」
| 指标 | 数值 |
|---|---|
| 匹配行数 | 12行 |
| 匹配行号 | 4, 90, 169, 197, 225, 317, 351, 362, 468, 483, 491, 496/502 |
| 有效片段 | 4条(第317行"币帛",第362行"桑麻",第483行"布线",第491行"夏葛") |
| 噪声行 | 8条(第4行"精蜜"中字,第90行"络丝"=天文,第169行"罗睺"=星名,第197行"班布"=分布,第225行"红纱"=比喻,第351行"羽毛"=动物,第468行"剃发"=剃头,第502行"翕聚"中字) |
第4轮:关键词「深衣章服冠服舆服丧服祭服赐服品色朝服衮黼黻」
| 指标 | 数值 |
|---|---|
| 匹配行数 | 4行 |
| 匹配行号 | 67, 68, 201, 332 |
| 有效片段 | 0条 |
| 噪声行 | 4条("衮"均为"衮衮/衮来/衮一番",意为滚动,非衮服) |
第5轮:关键词「织染裁缝文绣绣旌旗裙靴袜囊伞」
| 指标 | 数值 |
|---|---|
| 匹配行数 | 2行 |
| 匹配行号 | 403, 484 |
| 有效片段 | 0条 |
| 噪声行 | 2条(第403行"染"为比喻"未染只是白",第484行"粗衣"已入第1轮) |
五轮汇总
| 轮次 | 匹配行 | 有效 | 噪声 | 有效率 |
|---|---|---|---|---|
| 第1轮 | 10 | 8 | 2 | 80% |
| 第2轮 | 7 | 2 | 5 | 28.6% |
| 第3轮 | 12 | 4 | 8 | 33.3% |
| 第4轮 | 4 | 0 | 4 | 0% |
| 第5轮 | 2 | 0 | 2 | 0% |
| 合计 | 35 | 14(去重后11) | 21 | 31.4% |
三、去噪说明
噪声类型分析
| 噪声类型 | 数量 | 典型示例 |
|---|---|---|
| 同形异义(服≠服饰) | 2 | 第487行"服食"=服药;第485行"易服"有效但含非服饰义项 |
| 同形异义(履≠鞋履) | 2 | 第84行"履乎天末"=踏,第357行"足方履地"=踩 |
| 同形异义(带≠衣带) | 2 | 第109行"脐带",第147行"斜带黄道" |
| 同形异义(衮≠衮服) | 4 | 第67/68/201/332行,"衮衮"=滚动 |
| 同形异义(染≠染色) | 1 | 第403行"未染"=比喻本性纯洁 |
| 天文术语借词 | 3 | 第90行"络丝",第169行"罗睺",第147行"黄道带" |
| 比喻用法 | 2 | 第225行"红纱"形容彩虹,第197行"班布"=分布 |
| 动物身体部分 | 1 | 第351行"羽毛"=鸟兽之毛 |
| 重复已计入 | 2 | 第484行"粗衣"已入第1轮,第483行"布线"非服饰 |
去噪规则
- "服"字:仅保留"盛服""易服""吉服""五服"等服饰义项,排除"服食"(服药)、"服牛"(驯服)等
- "履"字:仅保留作为鞋履的用法,排除"履地"(踏地)、"践履"(实践)
- "带"字:仅保留衣带义项,排除"脐带""黄道带"
- "衮"字:全部为"衮衮"(滚动),非衮服,全部排除
- "染"字:仅保留染色工艺义项,排除比喻用法
- 天文术语:罗睺、黄道带、络丝等虽含关键词但与服饰无关,全部排除
四、有效片段表
| 序号 | 行号 | 卷次 | 关键词 | 分类 | 内容摘要 |
|---|---|---|---|---|---|
| 1 | 273 | 卷五·鬼神 | 盛服 | A.祭祀服饰 | 齐明盛服以承祭祀 |
| 2 | 314 | 卷五·鬼神 | 旒、冕、衣裳 | A.祭祀服饰 | 垂旒端冕衣裳而坐 |
| 3 | 317 | 卷五·鬼神 | 帛 | A.祭祀服饰 | 废币帛而用楮泉 |
| 4 | 499 | 卷八·异端 | 吉服 | B.丧服礼制 | 吉服不送其亲 |
| 5 | 501 | 卷八·异端 | 五服 | B.丧服礼制 | 五服年月勅 |
| 6 | 362 | 卷六·人物 | 桑、麻 | C.服饰材料 | 桑麻以衣之 |
| 7 | 491 | 卷八·异端 | 葛、裘 | C.服饰材料 | 夏葛而冬裘 |
| 8 | 484 | 卷八·异端 | 粗衣 | D.佛教与服饰 | 粗衣蔬食 |
| 9 | 485 | 卷八·异端 | 易服 | D.佛教与服饰 | 易服以逃租赋 |
| 10 | 330 | 卷六·人物 | 新衣 | E.日常服饰与气化论 | 新衣服生虮虱 |
| 11 | 483 | 卷八·异端 | 头巾 | E.日常服饰与气化论 | 裹头巾验佛灯 |
五、审核结论
数据质量评估
- 精确率:有效片段11条 / 总匹配35行 = 31.4%(五轮合计)
- 召回率评估:该书为理学类书,不含专门服饰论述,遗漏风险低。第4轮"衮"全部为噪声,第5轮无新增有效片段,说明关键词覆盖已充分。
- 信息密度:全书527行中有效服饰片段11条,信息密度2.1%,属极低密度文本。
提取可靠性
- 所有11条有效片段均经过原文对照核实,关键词在上下文中确属服饰义项
- 噪声排除标准一致,同形异义词均附排除理由
- 第4轮"衮"字4次出现均为"衮衮"(滚动),已全部正确排除
- 第2轮"履"字出现频次高但无一为鞋履义,反映理学文本中"履"多作动词使用的特点
学术审查意见
- 本书服饰内容零散且依附性强,不具备独立研究价值,但可作为宋元理学思想中服饰观念的辅助材料
- "垂旒端冕衣裳"条为民间祠庙神像服饰的珍贵记录,可与礼制文献交叉验证
- "夏葛而冬裘"条反映宋儒日常服饰选择,具有社会史参考价值
- "废币帛而用楮泉"条涉及丝帛→纸钱的祭祀用品转变,属于服饰文化外延