钦定辽金元三史国语解 — 处理日志

任务信息

项目内容
输入文件/home/z/my-project/upload/zhengshi/正史/钦定辽金元三史国语解.txt
输出目录/home/z/my-project/upload/正史重制output/钦定辽金元三史国语解/
处理日期2026-03-04

步骤记录

Step 1: wc -l

  • 总行数:17,278行

Step 2: grep -c 关键词命中统计

关键词命中数关键词命中数
32
1111
17
12
42
朝服11
绿184
8993
405
7128
23
18333
31

其余关键词命中为0:冕、弁、帻、幞头、进贤冠、武冠、通天冠、远游冠、半袖、衮服、冕服、祭服、常服、公服、法服、章服、燕服、丧服、赭、笏、鱼袋、鞶囊、香囊、簪、钗、步摇、舆服、车服、卤簿、仪仗、绢、绮、绫、纱、缯、缟、纨、赐服、赐紫、赐绯、借紫、借绯、服制、冠制、品色、服色、冠带

Step 3: grep -n 行号定位

  • 冠帽类:16条命中有服饰义
  • 衣裳类:28条命中有服饰义
  • 服制类:2条命中
  • 颜色类:120+条命中(大量为地名/人名修饰语)
  • 佩饰类:70+条命中("带"最多,需甄别)
  • 舆服/车服/卤簿/仪仗:0条命中
  • 纺织类:120+条命中("罗"占绝大多数,多非丝织品义)

Step 4: sed 上下文提取

  • 对服饰义明确的条目逐行提取全文
  • 共提取关键条目约60条(排除纯地名/人名中的颜色修饰语)

Step 5-6: 撰写3份MD并写入

甄别说明

1. "带"字甄别:128条命中中,约90%为蒙古语"岱/带"(意为"有也"),系人名地名尾缀,非服饰佩带之义。仅约15条与服饰带相关(陶罕=带板、布色=带子、鄂伦=肚带、托海=带饰/带极、苏布特齐=带珍珠人)。

2. "罗"字甄别:183条命中,绝大多数为音译人名/地名成分,非丝织品"罗"。

3. 颜色词甄别:青/黄/白/黑等高频色词多为地名/人名修饰语(如"博啰=青色"修饰山名),而非服饰颜色描述,但反映了辽金元服饰品色的语言根基。

4. "衣"字甄别:地理条中"衣卷怢"系"依卷帙"之意,非服饰。

输出文件

文件名说明
钦定辽金元三史国语解_总结.md服饰相关总结分析
钦定辽金元三史国语解_日志.md本文件,处理日志
钦定辽金元三史国语解_原文提取.md服饰相关原文提取