《元和姓纂》服饰内容提取——操作日志
基本信息
| 项目 |
内容 |
| 输入文件 |
/home/z/my-project/upload/part1_extracted/元和姓纂.txt |
| 文件大小 |
365,419字节(约357KB) |
| 输出目录 |
/home/z/my-project/upload/p1output/元和姓纂/ |
| 操作时间 |
2026-03-04 |
| 操作方式 |
严禁全文载入LLM,先grep提取再处理 |
操作流程记录
步骤1:文件大小检查
$ wc -c /home/z/my-project/upload/part1_extracted/元和姓纂.txt
365419
文件365KB,未超500KB阈值,但仍遵循禁止全文载入原则,全程使用grep+sed提取。
步骤2:创建输出目录
$ mkdir -p /home/z/my-project/upload/p1output/元和姓纂/
步骤3:第一轮grep——核心词(16词)
| 关键词 |
命中行数 |
真实服饰含义 |
备注 |
| 衣 |
4行 |
3处(尚衣奉御×2, 衣冠×1) |
余为人名 |
| 裳 |
4行 |
0处 |
全为人名(黄裳、裳吉) |
| 冠 |
约15行 |
3处(衣冠×1, 步摇冠×1, 鹖冠×1) |
余为姓氏/地名/军号 |
| 冕 |
4行 |
0处 |
全为人名 |
| 巾 |
0行 |
— |
— |
| 帽 |
0行 |
— |
— |
| 袍 |
0行 |
— |
— |
| 衫 |
0行 |
— |
— |
| 裙 |
0行 |
— |
— |
| 裘 |
4行 |
3处(裘氏起源×2, 邑裘×1) |
含姓氏源流 |
| 带 |
约8行 |
0处 |
全为人名/姓氏/地名 |
| 佩 |
2行 |
0处 |
全为人名 |
| 履 |
3行 |
0处 |
全为人名/姓氏 |
| 舄 |
0行 |
— |
— |
| 靴 |
0行 |
— |
— |
步骤4:第二轮grep——制度词(10词)
| 关键词 |
命中行数 |
备注 |
| 服色 |
0 |
— |
| 舆服 |
0 |
— |
| 冠服 |
0 |
— |
| 章服 |
0 |
— |
| 朝服 |
0 |
— |
| 祭服 |
0 |
— |
| 丧服 |
0 |
— |
| 吉服 |
0 |
— |
| 常服 |
0 |
— |
| 公服 |
0 |
— |
全部零命中。
步骤5:第三轮grep——材质词(15词)
| 关键词 |
命中行数 |
真实材质含义 |
备注 |
| 丝 |
0 |
— |
— |
| 帛 |
1 |
0 |
人名"强帛" |
| 绢 |
0 |
— |
— |
| 锦 |
0 |
— |
— |
| 绮 |
3 |
0 |
姓氏"绮里" |
| 绫 |
1 |
0 |
姓氏"绫氏"(案语指出为"缓"之误) |
| 罗 |
大量 |
0 |
姓氏"罗氏"为主 |
| 缎 |
0 |
— |
— |
| 绸 |
0 |
— |
— |
| 缂丝 |
0 |
— |
— |
| 葛 |
大量 |
0 |
姓氏"葛氏"为主 |
| 麻 |
2 |
0 |
姓氏目 |
| 布 |
4 |
0 |
人名/姓氏 |
| 褐 |
2 |
0 |
姓氏"褐余" |
步骤6:第四轮grep——品色词(10词)
| 关键词 |
命中行数 |
备注 |
| 紫袍 |
0 |
— |
| 绯袍 |
0 |
— |
| 绿袍 |
0 |
— |
| 赐紫 |
0 |
— |
| 赐绯 |
0 |
— |
| 鱼袋 |
0 |
— |
| 笏 |
0 |
— |
| 幞头 |
0 |
— |
| 金带 |
0 |
— |
| 玉带 |
1 |
人名"公玉带",非服饰品 |
几乎全部零命中。
步骤7:第五轮grep——配饰词(12词)
| 关键词 |
命中行数 |
真实配饰含义 |
备注 |
| 旂 |
0 |
— |
— |
| 旗 |
4 |
0 |
姓氏/人名 |
| 章 |
大量 |
0 |
绝大多数为人名 |
| 珮 |
0 |
— |
— |
| 环 |
3 |
0 |
姓氏/人名 |
| 玦 |
0 |
— |
— |
| 簪 |
0 |
— |
— |
| 钗 |
0 |
— |
— |
| 钿 |
0 |
— |
— |
| 翠 |
1 |
0 |
姓氏"翠氏" |
| 珠 |
0 |
— |
— |
| 玉 |
大量 |
0 |
人名/玉玺为主 |
步骤8:上下文提取
对确认有服饰含义的命中行,使用 sed -n '起始行,结束行p' 提取前后各5行上下文。提取行号范围:
- 行900-910(韦氏·尚衣奉御)
- 行1086-1094(毋将衣)
- 行1952-1962(衣冠华胄、牛氏)
- 行1961-1970(邱氏·尚衣奉御)
- 行2727-2737(赵氏·节裳奉御)
- 行3234-3244(慕容·步摇冠)
- 行1970-1980(裘氏)
- 行4030-4040(鹖冠)
- 行4370-4380(邑裘)
- 行1018-1024(绫氏)
- 行3759-3765(公玉带)
步骤9:分类整理与学术审查
将提取内容按服饰类别分类:
1. 服饰官职(尚衣奉御)
2. 衣冠合称(衣冠华胄)
3. 冠帽与姓氏起源(步摇冠、鹖冠、冠氏)
4. 裘皮与姓氏起源(裘氏、邑裘)
5. 姓氏中的服饰字(间接关联)
对抗式审查:对每条引文执行原文grep回验,确认全部真实存在。
步骤10:生成三篇MD
- 元和姓纂_原文提取.md — 带行号的原始服饰匹配片段
- 元和姓纂_总结.md — 服饰结构化综述+对抗式学术审查
- 元和姓纂_日志.md — 本文件,完整操作日志
关键数据汇总
| 指标 |
数值 |
| 检索关键词总数 |
63 |
| 有命中的关键词数 |
19 |
| 零命中关键词数 |
44 |
| grep总命中行数(含重复) |
约60+ |
| 有真实服饰含义的命中数 |
8条 |
| 产出MD文件数 |
3 |