皇极典宸翰部 — 服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 皇极典宸翰部 |
| 输入文件 | /home/z/my-project/upload/part4_extracted/皇极典宸翰部.txt |
| 输出目录 | /home/z/my-project/upload/p4output/皇极典宸翰部/ |
| 全文行数 | 162行 |
| 文本编码 | UTF-8 |
提取过程
第一步:全文阅读与结构识别
- 全文分为三大板块:
- 宸翰部艺文一(行2-8):表、记、跋、颂等散文
- 宸翰部艺文二(行9-14):诗歌
- 宸翰部纪事(行15-162):历代帝王书艺纪事
第二步:关键词检索
- 使用关键词组进行全文扫描:
- 衣冠类:衣、冠、袍、裘、裳、裙、巾、帽、履、褐、衫
- 佩饰类:带、笏、簪、冕、珩、佩、鞶
- 织物类:锦、绮、罗、纱、绢、绫、绣、绯、缣、缟、纩、绡
- 制度类:服、帔
- 共扫描关键词30+个
第三步:逐条甄别与提取
- 命中原始匹配数量:约80+处
- 去除无关/比喻/重复后,确认有效服饰条目:32条
- 其中:
- 直接服饰制度记载:5条
- 赐服赏物:12条
- 织物丝帛:7条
- 佩饰扇帔:6条
- 间接/比喻:2条
第四步:分类整理与撰写
- 按主题分为五大类:
1. 上古书体与衣冠制度
2. 朝服仪制中的衣冠
3. 赐服赏物
4. 御赐袍笏冠帔织物
5. 其他散见服饰词 - 每条附出处与按语
提取难点
- 服饰词汇多为比喻用法:如"锦绣"形容书法、"垂衣"喻无为而治、"不履袭古人轨辙"中"履"为动词——需逐一甄别排除。
- 赐服赏物与纯书法赏赐交织:如"赐袍笏犀带又以御书赐之",袍笏犀带为服制赐物,御书为书法赐物,需分清主次。
- "衣冠"一词多义:既可指具体服饰制度,也可指士大夫阶层("衣冠相绝"),需据上下文判断。
- 残句处理:如"倚绣"仅两字,缺乏上下文,但"绣"确属织物类,予以保留。
输出文件
| 文件名 | 内容 | 大小 |
|---|---|---|
| 皇极典宸翰部_原文提取.md | 32条服饰相关原文,分类整理附按语 | 约8KB |
| 皇极典宸翰部_总结.md | 统计分析、分类评估、核心发现 | 约4KB |
| 皇极典宸翰部_日志.md | 提取过程记录 | 约3KB |
最终统计
| 指标 | 数值 |
|---|---|
| 全文总行数 | 162行 |
| 服饰命中条目 | 32条 |
| 命中率 | 约3.2% |
| 直接服制描写 | 5条 |
| 综合丰富度 | ★☆☆☆☆(极低) |
| 输出总大小 | 约15KB |
日志记录完毕。