钦定辽金元三史国语解 — 处理日志
任务信息
| 项目 | 内容 |
|---|---|
| 输入文件 | /home/z/my-project/upload/zhengshi/正史/钦定辽金元三史国语解.txt |
| 输出目录 | /home/z/my-project/upload/正史重制output/钦定辽金元三史国语解/ |
| 处理日期 | 2026-03-04 |
步骤记录
Step 1: wc -l
- 总行数:17,278行
Step 2: grep -c 关键词命中统计
| 关键词 | 命中数 | 关键词 | 命中数 |
|---|---|---|---|
| 冠 | 3 | 巾 | 2 |
| 帽 | 11 | 衣 | 11 |
| 裳 | 1 | 袍 | 7 |
| 衫 | 1 | 袄 | 2 |
| 褐 | 4 | 裙 | 2 |
| 朝服 | 1 | 紫 | 1 |
| 绿 | 1 | 青 | 84 |
| 黄 | 89 | 白 | 93 |
| 黑 | 40 | 朱 | 5 |
| 佩 | 7 | 带 | 128 |
| 绶 | 2 | 帛 | 3 |
| 罗 | 183 | 锦 | 33 |
| 缎 | 3 | 绸 | 1 |
其余关键词命中为0:冕、弁、帻、幞头、进贤冠、武冠、通天冠、远游冠、半袖、衮服、冕服、祭服、常服、公服、法服、章服、燕服、丧服、赭、笏、鱼袋、鞶囊、香囊、簪、钗、步摇、舆服、车服、卤簿、仪仗、绢、绮、绫、纱、缯、缟、纨、赐服、赐紫、赐绯、借紫、借绯、服制、冠制、品色、服色、冠带
Step 3: grep -n 行号定位
- 冠帽类:16条命中有服饰义
- 衣裳类:28条命中有服饰义
- 服制类:2条命中
- 颜色类:120+条命中(大量为地名/人名修饰语)
- 佩饰类:70+条命中("带"最多,需甄别)
- 舆服/车服/卤簿/仪仗:0条命中
- 纺织类:120+条命中("罗"占绝大多数,多非丝织品义)
Step 4: sed 上下文提取
- 对服饰义明确的条目逐行提取全文
- 共提取关键条目约60条(排除纯地名/人名中的颜色修饰语)
Step 5-6: 撰写3份MD并写入
甄别说明
1. "带"字甄别:128条命中中,约90%为蒙古语"岱/带"(意为"有也"),系人名地名尾缀,非服饰佩带之义。仅约15条与服饰带相关(陶罕=带板、布色=带子、鄂伦=肚带、托海=带饰/带极、苏布特齐=带珍珠人)。
2. "罗"字甄别:183条命中,绝大多数为音译人名/地名成分,非丝织品"罗"。
3. 颜色词甄别:青/黄/白/黑等高频色词多为地名/人名修饰语(如"博啰=青色"修饰山名),而非服饰颜色描述,但反映了辽金元服饰品色的语言根基。
4. "衣"字甄别:地理条中"衣卷怢"系"依卷帙"之意,非服饰。
输出文件
| 文件名 | 说明 |
|---|---|
| 钦定辽金元三史国语解_总结.md | 服饰相关总结分析 |
| 钦定辽金元三史国语解_日志.md | 本文件,处理日志 |
| 钦定辽金元三史国语解_原文提取.md | 服饰相关原文提取 |