总结日志原文提取

《周礼注疏》服饰内容提取日志

任务ID:L8-1 执行时间:2026-03-05 操作员:rysxguji子Agent


1. 文本统计

项目 数值
文件大小 3,178,506 bytes
总行数 18,613行
文本量级 大型(>500KB,禁止整本载入)

2. 词库载入

3. 三轮Grep

第1轮:核心服饰词

rg -c '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|...' 周礼注疏.txt
→ 1104行命中

第2轮:制度动作词

rg -c '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 周礼注疏.txt
→ 53行命中

第3轮:组合扩展词

rg -c '大裘而冕|衮冕|鷩冕|毳冕|絺冕|玄冕|蚕|桑|茧|缫|织|纺|六服|司服|内司服|追师|屦人|缝人|染人|典丝|典枲|司裘' 周礼注疏.txt
→ 283行命中

合计:1440行命中(含大量重复交叉)

4. 审查排除

按词库排除规则表执行:

关键词 误命中数 处理
"衣冠"代指士大夫 保留——仍含服饰信息
"服药""服从""服丧" 排除非服饰义
"冠军""冠绝" 排除非首服义
"带领""地带" 排除动词/方位义
"麻制"=翰林诏书 排除;"麻衣"=丧服保留
"罗列""星罗棋布" 排除非丝织品义
"环境" 排除非首饰义

5. Sed提取关键段落

行号范围 内容
2554-2600 司裘·大裘/良裘/功裘
3082-3160 内司服·后六服/命妇服
8072-8160 司服·王吉凶衣服/六冕/弁服/吊服
3164-3185 屦人·王及后屦舄制度
448-462 典丝/典枲/染人/追师/屦人序官
420-444 内司服/缝人序官
2308-2312 佩玉制度
587-593 九贡·服贡/嫔贡
1010-1012 染人·四时染法

6. 分类

类别 核心内容
天子祭服(六冕) 大裘→衮冕→鷩冕→毳冕→希冕→玄冕
天子常服(三弁) 韦弁、皮弁、冠弁
王后六服 袆衣→揄翟→阙翟→鞠衣→展衣→褖衣
命妇服制 九嫔至士妻降杀
首服 冕/弁/副/编/次/衡/笄
足服 舄/屦制度
裘服 大裘/良裘/功裘
丝麻染织 典丝/典枲/染人/典妇功
丧服 斩衰/齐衰/吊服三衰
章纹 十二章→九章变迁说

7. 参考文档

8. 输出文件

文件 大小 说明
周礼注疏_总结.md ~6KB 含对抗式学术审查
周礼注疏_日志.md 本文件 操作流程记录
周礼注疏_原文提取.md ~12KB 关键原文片段

9. 踩坑记录

  1. 大文件禁止整本载入:3.18MB远超1MB限制,全程使用grep+sed提取
  2. OCR乱码:部分字如""(纁)、""(鷩)为OCR编码问题,已在提取中标注
  3. 贾疏冗长:贾公彦疏常复述郑注数百字,提取时需精简
  4. 行号密集:核心服饰段落集中在2554-2600、3082-3185、8072-8160三段