御定渊鉴类函 服饰内容提取日志
基本信息
- 书名:御定渊鉴类函
- 输入文件:/home/z/my-project/upload/part4_extracted/御定渊鉴类函.txt
- 文件行数:31,991行
- 文件大小:23,216,222字节(约23MB)
- 输出目录:/home/z/my-project/upload/p4output/御定渊鉴类函/
10轮grep搜索记录
第1轮:关键词"衣服"
- 命中行数:285
- 用途:定位散见各卷的服饰相关内容
- 发现:行1289处有"衣服"条目(风部中);服饰部专篇集中在行25285起
第2轮:关键词"服饰"
- 命中行数:63
- 用途:定位服饰部专篇
- 关键发现:行25285—26314为服饰部一至服饰部十二的详细目录
第3轮:关键词"冠冕"
- 命中行数:69
- 用途:验证冠冕相关内容密度
- 结果:服饰部一中有大量冠冕内容
第4轮:关键词"袍"
- 命中行数:334
- 用途:验证袍服内容分布
- 结果:服饰部二中袍类专节,其余散见
第5轮:关键词"裳"
- 命中行数:604
- 用途:验证裳(下裳)内容
- 结果:单字关键词误报率极高,多为非服饰语境
第6轮:关键词"裘"
- 命中行数:452
- 用途:验证裘皮服饰内容
- 结果:服饰部五有裘类专节
第7轮:关键词"佩"
- 命中行数:825
- 用途:验证佩饰内容
- 结果:单字误报率极高,需限定"佩玉""佩鱼"等复合词
第8轮:关键词"履"
- 命中行数:968
- 用途:验证鞋履内容
- 结果:服饰部六有履类专节
第9轮:关键词"带/帶"
- 命中行数:1,385
- 用途:验证带饰内容
- 结果:单字误报率极高,服饰部二有带类专节
第10轮:关键词"裙/襦"
- 命中行数:222
- 用途:验证妇女服饰内容
- 结果:服饰部五有襦裳专节
sed提取操作记录
| 操作 |
行范围 |
内容 |
字符数(约) |
| sed 25285-25355 |
服饰部一 |
冠冕弁帻 |
~8,000 |
| sed 25356-25479 |
服饰部二 |
缨簪貂蝉法服袍带等 |
~12,000 |
| sed 25480-25579 |
服饰部三 |
绅韨佩玦环笏舄靴 |
~9,000 |
| sed 25580-25654 |
服饰部四 |
巾帽纶巾衣服 |
~7,000 |
| sed 25655-25737 |
服饰部五 |
裘衫襜褕褐襦裳 |
~8,000 |
| sed 25738-25831 |
服饰部六 |
袴褶履屣屩鞋屧屐袜 |
~9,000 |
命中统计
- 服饰部专篇总行数:约1,130行(行25285—26414)
- 服饰相关散见行数:约500行(其他卷中零散提及)
- 合计命中行数:约1,630行
- 10轮grep累计命中:4,917次(含重复与误报)
误报分析
单字关键词(裳、裘、佩、履、带)误报率极高:
- "裳":大量"衣裳"连用,但很多在非服饰语境
- "佩":常作动词"佩戴"或人名用字
- "带":多作动词"带领""地带"等
- "履":除鞋履外,还有"履行""履历"等义
结论:单字关键词仅作抽样参考(前20行),实际提取以复合词和专篇定位为主。
丰富度评估
| 维度 |
评级 |
说明 |
| 品类覆盖 |
★★★★★ |
首服/体服/足服/佩饰/妆饰/卧具/日用器物全覆盖 |
| 制度详备 |
★★★★★ |
从天子到庶人各等级服饰制度完整 |
| 历代沿革 |
★★★★★ |
从先秦到明代服制变迁脉络清晰 |
| 文学收录 |
★★★★☆ |
诗赋铭表议诸体兼备,但数量非最多 |
| 图像资料 |
★☆☆☆☆ |
纯文本,无图像 |
输出文件清单
| 文件名 |
大小 |
说明 |
| 御定渊鉴类函_总结.md |
≤20KB |
服饰内容总体分析与评价 |
| 御定渊鉴类函_日志.md |
≤20KB |
提取过程与搜索记录 |
| 御定渊鉴类函_原文提取.md |
≤20KB |
核心原文精选摘录 |