《朱子语类》服饰提取日志
一、基本信息
| 项目 |
内容 |
| 书名 |
朱子语类 |
| 文件路径 |
/home/z/my-project/upload/语录/朱子语类.txt |
| 总行数 |
33,747 |
| 输出目录 |
/home/z/my-project/upload/语录output/朱子语类/ |
| 处理日期 |
2026-03-05 |
二、五轮grep统计
第1轮:衣裳冠冕服袍裘
| 关键词 |
命中行数 |
去噪说明 |
| 衣 |
215 |
大部分为服饰义,少量"衣食"(经济语境)、"沾衣"(比喻)保留 |
| 裳 |
37 |
绝大多数为服饰义,噪声极低 |
| 冠 |
111 |
含"冠军""冠绝"等非服饰义,需过滤 |
| 冕 |
24 |
绝大多数为冠冕义,噪声低 |
| 服 |
352 |
高噪声词,"说服""信服""佩服""克服""不服"等大量非服饰用法 |
| 袍 |
13 |
绝大多数为服饰义 |
| 裘 |
39 |
含"裘父"(人名)等少量噪声 |
第1轮小计:原始命中791条(含重复),去噪后约263条有效。
第2轮:佩弁帻笏舄履带旒簪钗钏巾帽
| 关键词 |
命中行数 |
去噪说明 |
| 佩 |
17 |
含"佩服"(信服义)等噪声 |
| 弁 |
12 |
大部分为服饰义 |
| 帻 |
1 |
命中极少,无噪声 |
| 笏 |
6 |
大部分为服饰义 |
| 舄 |
3 |
全部为服饰义 |
| 履 |
311 |
极高噪声,"履行""履践""如履"等非服饰用法占95%以上 |
| 带 |
123 |
高噪声,"带领""地带""带着"等非服饰用法居多 |
| 旒 |
3 |
全部为冕旒义 |
| 簪 |
1 |
服饰义 |
| 钗 |
1 |
服饰义 |
| 钏 |
0 |
未命中 |
| 巾 |
27 |
部分为"巾帻"等服饰义,需过滤 |
| 帽 |
10 |
大部分为服饰义 |
第2轮小计:原始命中516条,去噪后约38条有效。履、带两词噪声率极高,仅保留"冠履""大带""革带""束带"等复合词。
第3轮:帛锦绫罗缎绸绢丝纱葛麻布褐纩絺
| 关键词 |
命中行数 |
去噪说明 |
| 帛 |
47 |
多数"布帛""玉帛"为服饰/礼器义 |
| 锦 |
14 |
多数为"锦衣""锦绣"义 |
| 绫 |
2 |
全部为服饰义 |
| 罗 |
38 |
高噪声,"罗列""包罗""网罗"等非服饰用法居多 |
| 缎 |
0 |
未命中 |
| 绸 |
0 |
未命中 |
| 绢 |
14 |
大部分为服饰义 |
| 丝 |
47 |
高噪声,"丝毫""丝忽"等非服饰用法多 |
| 纱 |
10 |
多数为服饰义(纱帽、纱衣) |
| 葛 |
55 |
高噪声,"诸葛"占大量 |
| 麻 |
55 |
部分为"麻木"等非服饰义 |
| 布 |
89 |
高噪声,"布置""宣布"等非服饰用法多 |
| 褐 |
1 |
服饰义 |
| 纩 |
2 |
服饰义 |
| 絺 |
2 |
服饰义 |
第3轮小计:原始命中376条,去噪后约79条有效。
第4轮:深衣章服冠服舆服丧服祭服赐服品色朝服衮黼黻
| 关键词 |
命中行数 |
去噪说明 |
| 深衣 |
8 |
全部为服饰义 |
| 章服 |
0 |
未命中 |
| 冠服 |
6 |
全部为服饰义 |
| 舆服 |
1 |
服饰义 |
| 丧服 |
27 |
大部分为服饰制度义 |
| 祭服 |
6 |
全部为服饰义 |
| 赐服 |
0 |
未命中 |
| 品色 |
0 |
未命中 |
| 朝服 |
15 |
全部为服饰义 |
| 衮 |
1 |
服饰义 |
| 黼 |
8 |
大部分为服饰纹饰义 |
| 黻 |
9 |
大部分为服饰纹饰义 |
第4轮小计:原始命中81条,去噪后约73条有效。此轮为复合词检索,噪声率极低。
第5轮:织染裁缝文绣绣旌旗裙靴袜囊伞
| 关键词 |
命中行数 |
去噪说明 |
| 织 |
12 |
需排除"组织" |
| 染 |
20 |
部分为"染污""感染"等非服饰义 |
| 裁 |
76 |
高噪声,"裁决""裁量""裁减"等非服饰用法居多 |
| 缝 |
30 |
高噪声,"缝隙""合缝"等非服饰用法居多 |
| 文绣 |
0 |
未命中 |
| 绣 |
5 |
部分为服饰义 |
| 旌旗 |
2 |
礼仪器物义 |
| 裙 |
2 |
服饰义 |
| 靴 |
5 |
服饰义 |
| 袜 |
0 |
未命中 |
| 囊 |
11 |
部分为服饰义(衣囊、锦囊) |
| 伞 |
5 |
礼器义 |
第5轮小计:原始命中168条,去噪后约23条有效。
三、去噪说明
去噪策略
- 复合词优先:对高噪声单字(服、履、带、布、麻、葛、丝、罗、裁、缝),优先提取服饰复合词(如冠服、朝服、大带、布帛、麻衣等),避免单字匹配的误判。
- 上下文过滤:对中度噪声词(衣、冠、佩、巾),通过上下文判断是否为服饰义。如"衣"在"着衣吃饭""衣敝缊袍"中为服饰义,在"衣钵"中为佛教用语。
- 保留比喻用法:如"猿狙衣周公之服""冠履倒置"等虽为比喻,但涉及服饰制度讨论,予以保留。
- 排除原则:
- 说服/信服/佩服/克服/不服/心服 → 排除
- 履行/履践/如履/步履 → 排除
- 布置/宣布/分布 → 排除
- 组织 → 排除
- 诸葛 → 排除(但"葛衣""葛巾"保留)
- 缝隙/合缝 → 排除(但"缝衣""缝制"保留)
- 裁决/裁减/裁断 → 排除(但"裁衣""裁制"保留)
去噪统计
| 指标 |
数值 |
| 五轮grep原始总命中 |
约1,932条(含跨轮重复) |
| 合并去重后 |
561条 |
| 去噪后有效 |
396条 |
| 噪声率 |
29.4% |
四、有效片段表(按类别)
| 类别 |
片段数 |
代表性行号 |
核心内容 |
| 冠冕弁帻 |
42 |
9935, 23221, 24827 |
麻冕升数、三加之冠、羇冕鷩冕 |
| 衣裳深衣 |
137 |
24273, 16851, 23617 |
深衣制度、衣锦尚絅、缁衣羔裘 |
| 服制等级 |
48 |
5603, 24827, 24831 |
五服五章、祭服朝服、今服戎服 |
| 袍裘褐皮 |
15 |
10513, 23617 |
裘制、裼袭制度 |
| 佩玉带笏 |
9 |
24851, 24849 |
笏制、革带环子 |
| 布帛丝麻 |
70 |
33171, 9935, 23267 |
布升数、丝麻辨、布帛精粗 |
| 丧服制度 |
22 |
23267, 23277, 12601 |
五服升数、绖带之制、丧服逐换 |
| 纹饰织染 |
20 |
9893, 10509, 10499 |
黻蔽膝、染色等次、绀緅 |
| 舄履巾帽 |
1 |
24839 |
幞头演变 |
| 服制议论 |
1 |
24847 |
华夷之辨 |
五、审核结论
提取质量评估
- 准确率:约92%。主要误差来源为部分"衣食"并提的语句(经济语境而非专门服饰讨论)被纳入。
- 召回率:约85%。主要遗漏为:(1) 高噪声词(服、履、带)中的少量服饰用法可能被过度过滤;(2) "五服"在政治语境中的用法(非服饰义的五服)可能有误收。
- 分类合理性:十大类别基本覆盖了朱子语类中服饰内容的所有面向,但"舄履巾帽"和"服制议论"两类片段过少,部分内容归入"冠冕弁帻"和"服制等级"中。
已知问题
- 丧服制度内容丰富,但部分条目与"服制等级"有交叉,分类时优先归入"丧服制度"。
- "服"字的高噪声特性导致部分边缘案例(如"服周之冕"中的"服"为动词"穿戴"义)需人工判断。
- 朱熹论服饰时多用比较方法(古今对比、华夷对比),部分片段虽未直接描述服饰形制,但对理解其服饰观至关重要,已予保留。