《周礼注疏》服饰内容提取日志
任务ID:L8-1
执行时间:2026-03-05
操作员:rysxguji子Agent
1. 文本统计
| 项目 |
数值 |
| 文件大小 |
3,178,506 bytes |
| 总行数 |
18,613行 |
| 文本量级 |
大型(>500KB,禁止整本载入) |
2. 词库载入
- 词库路径:
/home/z/my-project/upload/rysxguji0518/rysxguji/references/fushi-keywords.md
- 核心服饰词:首服、体服、下服、足服、腰带、佩饰、礼服、衣料、染色纹样等9大类
- 制度动作词:赐予、禁令、等级、礼仪、日常等5类
- 组合扩展词:品色制度、冕服体系、蚕桑纺织等8主题
- 排除规则:按词库第四部分逐条执行
3. 三轮Grep
第1轮:核心服饰词
rg -c '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|...' 周礼注疏.txt
→ 1104行命中
第2轮:制度动作词
rg -c '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 周礼注疏.txt
→ 53行命中
第3轮:组合扩展词
rg -c '大裘而冕|衮冕|鷩冕|毳冕|絺冕|玄冕|蚕|桑|茧|缫|织|纺|六服|司服|内司服|追师|屦人|缝人|染人|典丝|典枲|司裘' 周礼注疏.txt
→ 283行命中
合计:1440行命中(含大量重复交叉)
4. 审查排除
按词库排除规则表执行:
| 关键词 |
误命中数 |
处理 |
| 衣 |
"衣冠"代指士大夫 |
保留——仍含服饰信息 |
| 服 |
"服药""服从""服丧" |
排除非服饰义 |
| 冠 |
"冠军""冠绝" |
排除非首服义 |
| 带 |
"带领""地带" |
排除动词/方位义 |
| 麻 |
"麻制"=翰林诏书 |
排除;"麻衣"=丧服保留 |
| 罗 |
"罗列""星罗棋布" |
排除非丝织品义 |
| 环 |
"环境" |
排除非首饰义 |
5. Sed提取关键段落
| 行号范围 |
内容 |
| 2554-2600 |
司裘·大裘/良裘/功裘 |
| 3082-3160 |
内司服·后六服/命妇服 |
| 8072-8160 |
司服·王吉凶衣服/六冕/弁服/吊服 |
| 3164-3185 |
屦人·王及后屦舄制度 |
| 448-462 |
典丝/典枲/染人/追师/屦人序官 |
| 420-444 |
内司服/缝人序官 |
| 2308-2312 |
佩玉制度 |
| 587-593 |
九贡·服贡/嫔贡 |
| 1010-1012 |
染人·四时染法 |
6. 分类
| 类别 |
核心内容 |
| 天子祭服(六冕) |
大裘→衮冕→鷩冕→毳冕→希冕→玄冕 |
| 天子常服(三弁) |
韦弁、皮弁、冠弁 |
| 王后六服 |
袆衣→揄翟→阙翟→鞠衣→展衣→褖衣 |
| 命妇服制 |
九嫔至士妻降杀 |
| 首服 |
冕/弁/副/编/次/衡/笄 |
| 足服 |
舄/屦制度 |
| 裘服 |
大裘/良裘/功裘 |
| 丝麻染织 |
典丝/典枲/染人/典妇功 |
| 丧服 |
斩衰/齐衰/吊服三衰 |
| 章纹 |
十二章→九章变迁说 |
7. 参考文档
/home/z/my-project/upload/参考/总结.md——模板参考(《吕氏春秋》总结)
/home/z/my-project/upload/参考/日志.md——模板参考(《晋会要》日志)
/home/z/my-project/upload/参考/原文提取.md——模板参考(《天工开物》原文提取)
8. 输出文件
| 文件 |
大小 |
说明 |
| 周礼注疏_总结.md |
~6KB |
含对抗式学术审查 |
| 周礼注疏_日志.md |
本文件 |
操作流程记录 |
| 周礼注疏_原文提取.md |
~12KB |
关键原文片段 |
9. 踩坑记录
- 大文件禁止整本载入:3.18MB远超1MB限制,全程使用grep+sed提取
- OCR乱码:部分字如""(纁)、""(鷩)为OCR编码问题,已在提取中标注
- 贾疏冗长:贾公彦疏常复述郑注数百字,提取时需精简
- 行号密集:核心服饰段落集中在2554-2600、3082-3185、8072-8160三段