《文苑英华》服饰内容提取 · 工作日志

时间:2026-05-09


操作流程

Step 1: 确认输入文件

Step 2: 多轮grep搜索

关键词匹配行数
1391
966
799
666
644
451
391
368
355
345
307
衣冠267
253
233
196
172
159
衣裳131
金紫127
106
103
95
87
87
86
布衣84
80
80
77
66
63
61
60
59
冠带41
黼黻40
32
缁衣30
貂蝉30
被褐27
补衮26
章服26
26
衮职25
朝服25
25
介胄23
左袵21
冕服20
朱衣17
法服15
绛纱15
椎髻14
赤绂12
戎服12
衮服11
祭服11
纮綖11
衮冕9
衣褐9
衮龙8
被发8
绯衣7
丧服6
幅巾6
6
左衽5
韦带5
皮弁5
冠缨5
毡裘4
赐服4
旃裘3
绛纱袍3
衮阙2
卉裳2
深衣2
九旒2
紫袍1
貂襜褕1

总匹配行数:10053

有效服饰段落数:2338

收录段落数:100

Step 3: 噪音过滤

Step 4: 分类整理

Step 5: 保存三份文件


文件大小


审核结果

原文均从grep -n搜索提取,有明确行号对应。《文苑英华》服饰内容约2338段有效段落,收录100段。已据实整理,未灌水凑字。