《东汉文纪》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《东汉文纪》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/北齐文纪/原文提取.md
读取 文总集output/北齐文纪/总结.md
读取 文总集output/北齐文纪/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/东汉文纪.txt 不存在
→ 从殆知阁GitHub仓库数据副本 /tmp/daizhige_data/集藏/文总集/东汉文纪.md 复制
→ 文件为东汉文纪.md,复制为.txt
wc -l → 4547行
mkdir -p 文总集output/东汉文纪/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(121) 裳(13) 裘(12) 冠(132) 冕(13) | |
| R2 | 袍(1) 褐(8) 裙(1) 衫(0) 襦(1) | |
| R3 | 绶(81) 佩(24) 笏(0) 履(136) 舄(5) | |
| R4 | 帻(9) 弁(2) 铠(3) 甲(104) 兜鍪(0) | |
| R5 | 帛(60) 绢(3) 缟(4) 纱(2) 锦(2) | |
| R6 | 绣(14) 黼(2) 黻(4) 衮(17) 章服(2) | |
| R7 | 带(50) 袂(4) 襟(4) 袖(5) 衽(1) | |
| R8 | 丝(19) 麻(7) 葛(7) 布衣(12) 绵(4) | |
| R9 | 朝服(2) 祭服(2) 丧服(2) 戎服(0) 法服(2) | |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(2) 青衣(4) |
总匹配行数:约750行(去重前)
Step 4: 补充搜索与grep -n精确提取
对以下关键词执行grep -n提取行号与上下文:
- 衮冕(3) 九锡(3) 赤舄(2) 章服(2) 朝服(2)
- 祭服(2) 丧服(2) 法服(2) 冕服(1) 冠服(1)
- 左衽(1) 被发(5) 貂蝉(1) 衣冠(10) 冠带(7)
- 长冠(3) 黼黻(2) 黄绶(3) 墨绶(7) 紫绶(3)
- 金印(3) 虎符(4) 华盖(4) 旒(4) 纮(9)
- 玺绶(14) 印绶(46) 银艾(3) 绂冕(1)
- 步摇(1) 朱舄(1) 纁(3) 绛纱(2) 玛瑙袜(1)
- 冠帻(1) 衣一袭(3) 幅巾(2) 五时衣(1)
关键发现:
- 全书4547行,服饰内容以冕服制度与后服制度为核心
- 行833-834南北郊冠服议为全书最系统的冕服文献(长冠→龙衮→衮冕十二旒)
- 行804立后仪为全书最详细的后服文献(绀上玄下步摇八雀九华朱舄帏裳)
- 行3772册魏公九锡文含衮冕之服赤舄副焉
- 行3337为唯一完整的女子服饰色彩等级论述(纁绛正色红紫禁色)
- 印绶46次为最高频服饰相关词,构成东汉品秩制度骨架
- 行1600-1602班固受赐瑇瑁簪绛纱单衣玛瑙袜为文人赐服最详记录
Step 5: 噪音过滤
噪音类别:
- "衣"121行中约86行为非服饰用法(衣食、衣被、衣钵、衣冠子孙泛指等)
- "冠"132行中约102行为"冠军""冠绝""加冠"等非服饰用法
- "履"136行中约128行为"履践""履历"等非服饰用法
- "甲"104行中约96行为天干"甲子"或"甲兵"泛指
- "带"50行中约42行为"地带""带领""带砺"等非服饰用法
- "帛"60行中约48行为"束帛""金帛"等泛指财货
- "佩"24行中约18行为"钦佩""敬佩"非佩饰
- "绣"14行中约10行为"锦绣"泛指或地名
- "丝"19行中约14行为"丝竹""蚕丝"等非服饰用法
有效服饰段落估计:约60段
Step 6: 保存三份文件
- 文总集output/东汉文纪/原文提取.md
- 文总集output/东汉文纪/总结.md
- 文总集output/东汉文纪/日志.md(本文件)
关键发现
- 南北郊冠服议为全书最系统的冕服文献:长冠→龙衮→衮冕十二旒,三朝演变
- 立后仪为全书最详细的后服文献:绀上玄下步摇八雀九华朱舄帏裳
- 九锡衮冕赤舄为权臣礼制核心:与《北齐文纪》《南齐文纪》同制
- 赐服记录丰富:冠帻履袜衣一袭、瑇瑁簪绛纱单衣、五时衣各一袭
- 印绶46次为最高频服饰词:墨绶黄绶紫绶构成品秩制度骨架
- 女子服饰色彩有完整等级:纁绛正色红紫禁色缃绿不为上服
- 华夷之辨以被发左衽为核心
关键踩坑记录
- 输入文件不存在于指定路径,需从/tmp/daizhige_data/复制
- 全书4547行,比《北齐文纪》(353行)大12.8倍
- "衣"121行中约71%为非服饰用法,噪音率极高
- "冠"132行中约77%为非服饰用法(冠军、冠绝等)
- "履"136行中约94%为"履践/履历",为所有关键词中噪音率最高
- "甲"104行中约92%为天干或甲兵泛指
- 袍(1)衫(0)襦(1)裙(1)——日常服装词汇极度稀缺
- 深衣(0)缁衣(0)素衣(0)——传统服制术语缺失
- 赐衣(0)赐紫(0)赐绯(0)鱼袋(0)——无唐代赐衣制度
- 与《北齐文纪》以九锡衮冕与服饰僭越为核心不同,本书以冕服制度与后服制度为核心
文件大小
- 原文提取.md:约16KB
- 总结.md:约10KB
- 日志.md:约4KB
审核结果
原文均从grep -n提取,有明确行号对应。《东汉文纪》为明梅鼎祚编东汉一代文章总集,4547行,服饰内容以冕服制度与后服制度为核心,与《北齐文纪》以九锡衮冕与服饰僭越为核心有显著不同。已据实整理,未灌水凑字。