黄氏日抄

《黄氏日抄》服饰提取日志

一、基本信息

项目 内容
书名 黄氏日抄
作者 宋·黄震
文件路径 /home/z/my-project/upload/语录/黄氏日抄.txt
总行数 16,165行
提取日期 2026年3月4日
输出目录 /home/z/my-project/upload/语录output/黄氏日抄/

二、五轮grep统计

第1轮:衣裳冠冕服袍裘

关键词 命中行数 备注
433 含衣冠、衣服、衣裳、深衣等复合词
68 含衣裳、下裳、冠裳等
215 含冠礼、冠冕、弱冠、缁布冠等
76 含冕服、衮冕、冕弁等
763 噪声最高,含服膺、服从、不服等非服饰用法
6 含衮袍、锦袍等
50 含狐裘、大裘、衣裘等
去重后合计 1,218

第2轮:佩弁帻笏舄履带旒簪钗钏巾帽

关键词 命中行数 备注
51 含佩玉、佩鱼、佩服等
69 含皮弁、爵弁、韦弁等
3
18
2
95 含履约、履历等非服饰用法
121 含地带、一带等非服饰用法
10
1
4
0 本书无此字
32 含巾栉、头巾等
5
去重后合计 375

第3轮:帛锦绫罗缎绸绢丝纱葛麻布褐纩絺

关键词 命中行数 备注
97 含玉帛、束帛、布帛等
40 含锦衣、锦袍等
2
80 含罗列等非服饰用法
0 本书无此字
7
27
51 含丝毫、丝竹等非服饰用法
3
84 含葛衣、葛巾、人名等
115 含麻衣、丧服麻等
228 含分布、宣布等大量非服饰用法
5
11
13
去重后合计 642

第4轮:深衣章服冠服舆服丧服祭服赐服品色朝服衮黼黻

关键词 命中行数 备注
深衣 17
章服 4
冠服 0
舆服 0
丧服 8
祭服 17
赐服 2
品色 0
朝服 29
37 含衮职、衮衣、衮冕等
21
10
去重后合计 125

第5轮:织染裁缝文绣绣旌旗裙靴袜囊伞

关键词 命中行数 备注
26
48 含传染等比喻用法
裁缝 0
文绣 4
23
旌旗 5
2
3
1
22 含囊瓦(人名)等非服饰用法
2
去重后合计 187

五轮汇总

轮次 关键词数 原始命中行数 去重后行数
第1轮 7 1,611 1,218
第2轮 13 411 375
第3轮 15 774 642
第4轮 12 145 125
第5轮 11 136 187
合并去重 1,903

三、去噪说明

3.1 噪声来源分析

全书16,165行中,五轮grep原始命中1,903行,经分析存在以下噪声类型:

噪声类型 典型示例 估计影响行数
"服"字非服饰用法 服膺、服从、不服、服用(药)、降服 ~590行
"冠"字非服饰用法 冠军、冠绝、及冠 ~10行
"带"字非服饰用法 地带、一带、带领 ~80行
"履"字非服饰用法 履行、履约、履历 ~30行
"布"字非服饰用法 分布、宣布、布置、布局 ~150行
"丝"字非服饰用法 丝毫、丝竹 ~20行
"罗"字非服饰用法 罗列、搜罗 ~30行
"佩"字非服饰用法 佩服、钦佩、敬佩 ~5行
"染"字非服饰用法 传染(比喻义) ~15行
"囊"字非服饰用法 囊瓦(人名) ~5行
五服/九服畿服制 非服饰之"服" ~15行

3.2 去噪策略

采用复合词优先+反向排除双重策略:

  1. 复合词优先:仅匹配预定义的服饰复合词列表(如衣冠、朝服、皮弁等),避免单字匹配噪声
  2. 反向排除:对含服饰关键词但语境明显非服饰的行(如"佩服"、"地带")予以排除
  3. 质量分级:对无法确定是否为服饰内容的条目标记为"medium"质量

3.3 去噪结果

阶段 行数
五轮grep合并去重 1,903
复合词过滤后 655
其中high质量 549
其中medium质量 106
噪声排除率 65.6%

四、有效片段表

按类别统计有效片段:

类别 high medium 合计
冠冕头饰 122 53 175
衣裳袍服 118 48 166
纺织布帛 164 0 164
佩饰带履 57 3 60
丧祭礼服 49 1 50
服饰制度 39 1 40
合计 549 106 655

按卷次统计有效片段(前10卷):

卷次 条目数 主要内容
卷二十·读礼记【七】 89 冠制、笏制、带制、深衣、祭服
卷十九·读礼记【六】 48 弁制、朝服、祭服、丧服
卷二十二(读礼记) 46 深衣、玉藻、冠制
卷十六·读礼记 42 帛制、织物、祭服
卷十五·读礼记【二】 28 丧服、冠礼
卷十四·读礼记【一】 24 朝服、祭服、冠制
卷二十七·读礼记【十四】 23 衣服、衣冠
卷十八·读礼记【五】 17 丧服、素服
卷五十·读史 14 帛、布衣
卷四·读毛诗 13 缁衣、裘服、衮职

五、审核结论

5.1 提取完整性评估

5.2 提取准确性评估

5.3 学术价值评估

5.4 对抗式审查发现

分类争议(16条)

问题类型 数量 处理方式
弱冠归入冠冕头饰 3条 保留——弱冠源于冠礼制度,与冠制直接相关
帛作为外交礼品 7条 保留——帛在古代兼具织物与礼品双重属性,不可割裂
衣服泛称使用 4条 保留——泛称使用仍反映服饰观念

遗漏术语(2个)

术语 出现行号 处理方式
端衣 L5907 应补充——端衣为玄端之衣,重要礼服
委貌 L5721-5722 应补充——委貌为周代常服之冠

五服/九服混淆(10条)

五服一词在《黄氏日抄》中兼具两义: 1. 畿服制度:甸服、侯服、绥服、要服、荒服——属行政区划 2. 丧服制度:斩衰、齐衰、大功、小功、缌麻——属服饰范畴

经审查,10条五服相关条目中: - 明确为畿服制度:1条(L622) - 明确为丧服制度:4条(L4521, L6396, L6645, L7662) - 语境不明:5条(L6055, L6395, L7588, L7665, L9623)

两类五服均予保留,因畿服制度亦是服制研究的重要参照。

关键词可靠性评估

可靠性 关键词 说明
高度可靠 弁(69)、朝服(28)、缨(27)、绢(26)、织(25)、皮弁(24)、衣冠(22) 专指性强,无不服饰用法
基本可靠 衣服(67)、衣裳(20)、布衣(21)、祭服(17)、深衣(17) 偶有泛称但主体为服饰
需注意 帛(97)、染(48) 帛含礼品义,染含比喻义
弱信号 弱冠(9)、旌旗(5) 弱冠指年龄,旌旗为旗帜非服饰