事类赋 — 服饰整理操作日志

操作时间:2026-03-04
操作对象:/home/z/my-project/upload/part1_extracted/事类赋.txt
输出目录:/home/z/my-project/upload/p1output/事类赋/


一、文件基本信息


二、五轮grep统计

第一轮:核心词(15词)

关键词 匹配行数 主要分布
73 全书散见,L355-356为专章
16 多在衣章及引文中
41 L357-358为专章,散见他章
6 冠章及玉章
18 衣章、冠章、扇章
3 L211, L432, L459
5 衣章及马章
1 L213
4 衣章及冬赋
19 衣章为主,散见冬雪章
40 全书广布
28 玉章、衣章、冠章
22 衣章、弓章、多章散见
4 衣章
1 L356(衣章)

第二轮:制度词(10词)

关键词 匹配行数 说明
服色 0 未命中
舆服 6 车章(L434)、衣章、冠章等
冠服 0 未命中
章服 0 未命中
朝服 3 L151,L184,L356
祭服 1 L356
丧服 0 未命中
吉服 0 未命中
常服 7 多章散见(多为人名"常"误匹配)
公服 3 L285,L356,L586

第三轮:材质词(14词)

关键词 匹配行数 说明
30 丝章(L307-308)专述,散见全书
16 多为"布帛""缯帛"
7 多为"绢"字散见
19 锦章(L305-306)专述
13 多为"绮"字散见
2 L198,L308
28 多为"罗"字散见(含"罗网"等非服饰义)
0 未命中
1 L308
缂丝 0 未命中
40 多为"葛"字散见(含地名"葛"等)
16 多为"麻"字散见
55 多为"布"字散见(含"分布""宣布"等非服饰义)
6 衣章"无褐何以卒岁"等

第四轮:品色词(10词)

关键词 匹配行数 说明
紫袍 0 未命中
绯袍 0 未命中
绿袍 0 未命中
赐紫 0 未命中
赐绯 0 未命中
鱼袋 0 未命中
1 L310(钱刀章)
幞头 0 未命中
金带 1 L308
玉带 0 未命中

第四轮说明:品色词大面积未命中,原因如下——

第五轮:配饰词(12词)

关键词 匹配行数 说明
3 车章
9 车章、弓章等
60 多为"文章""章句"等非服饰义
0 未命中(本书用"佩"不用"珮")
24 多为人名、地名
5 玉章为主
4 冠章"玳瑁簪"等
3 珠章"玉钗""玉燕钗"
0 未命中
13 冠章"翠緌"、珠章"翡翠"等
41 珠章专述,散见全书
73 玉章专述,散见全书

三、噪声过滤说明

五轮grep共产生771条命中记录,涉及110个唯一行号。其中大量命中为噪声:

  1. "衣"字噪声:如"埋不生衣"(金属生锈义)、"衣"作动词(穿衣)等
  2. "布"字噪声:如"分布""宣布""布告"等非织物义
  3. "章"字噪声:如"文章""章句"等非章服义
  4. "带"字噪声:如"地带""带以弓韣"等非腰带义
  5. "佩"字噪声:如"自佩"(佩剑)等
  6. "常服"误匹配:多为人名"常"+"服"字组合,非制度词"常服"

经过人工审读,实际服饰相关内容集中在L286-289、L305-308、L355-358、L434等行。


四、提取操作记录

  1. wc -c 事类赋.txt → 836760字节(>500KB,禁止全文读取)✅
  2. 逐词grep统计命中数 ✅
  3. Python收集全部命中行号 → 110个唯一行 ✅
  4. 合并±5行上下文范围 → 22个合并范围,覆盖490行 ✅
  5. 人工审读核心服饰章节(衣、冠、锦、丝、玉、珠) ✅
  6. 分类整理服饰制度、典故、材质 ✅
  7. 对抗式审查:20条核心引文逐条grep验证 ✅

五、产出文件

文件 大小 说明
事类赋_总结.md ~8KB 服饰结构化综述+对抗式审查
事类赋_日志.md ~6KB 本文件,完整操作日志
事类赋_原文提取.md ~17KB 带行号的原始服饰匹配片段

六、关键发现

  1. 《事类赋》服饰内容以衣、冠二章为最核心,篇幅最长、征引最富
  2. 本书用"佩"不用"珮",用"常服"多非制度词义
  3. 品色词(紫袍、绯袍、幞头、鱼袋等)全部未命中,反映本书时代特征
  4. 舆服制度散见于车章,需与衣冠章对读
  5. 锦、丝二章虽在"服用部",但侧重织物本身,服饰制度信息较少

日志完成。