《明实录穆宗实录》服饰提取操作日志
一、文件基本信息
| 项目 | 数据 |
|---|---|
| 文件路径 | /root/.openclaw/workspace/别史/明实录穆宗实录.txt |
| 文件大小 | 1,461,053 字节 |
| 总行数 | 5,898 行 |
| 朝代 | 明穆宗隆庆年间(1567-1572) |
| 卷数 | 70卷 |
二、grep检索统计
关键词组检索结果
| 轮次 | 关键词 | 匹配行数 | 有效服饰段落 |
|---|---|---|---|
| 1 | 衣|裳|袍|衫|裙|袄|裤|袜|履|鞋|靴|舄 | 80+ | 约15段(丧服、册封仪注为主) |
| 2 | 冠|冕|弁|帽|幞头|帻|笠 | 80+ | 约20段(皇太子加冠、即位、册封等) |
| 3 | 绢|绫|罗|缎|锦|绮|丝|绸|布|麻|葛|棉|苎 | 80+ | 约10段(赐赏纻丝绢布、织造物料) |
| 4 | 裘|皮|貂|狐|羊|麂 | 80+ | 约3段(皮张物料、赐猪羊等,多非服饰) |
| 5 | 赐服|赐紫|赐绯|借紫|借绯 | 0 | 无直接匹配 |
| 6 | 服色|品色|章服|冠服|舆服|制服 | 40+ | 约8段(冠服制作、浅淡服色、三品服色等) |
| 7 | 鱼袋|笏|佩|簪|钗|钏|坠|环 | 60+ | 约5段(佩弓韣、簪结纮、脱簪珥等) |
| 8 | 染|绣|织|裁|缝|绩|纺 | 60+ | 约8段(织造、染料、织金衣等) |
| 9 | 补服|补子|文官|武官 | 40+ | 约5段(文武官祭服随行等) |
| 10 | 带 | 80+ | 约15段(黑角带、腰绖、黑犀带、鸾带等) |
汇总
- grep总匹配行数:约500+行(去重后约300行)
- 提取上下文段落:约80段
- 确认为服饰记载的段落:约45段
- 最终提取内容量:约15,000字
三、操作步骤记录
- 使用
wc -c和wc -l确认文件大小 - 分10轮执行
grep -n关键词检索 - 对命中行号使用
sed -n '行-5,行+10p'提取上下文 - 逐段筛选,剔除无关匹配(如"衣食之原""衣袖至于敝垢"等非服饰记载)
- 按丧服、御用冠服、后妃冠服、东宫冠服、赐服、织造、朝仪、禁奢8类归类
- 撰写总结、日志、原文提取三份文档
四、排除的无关匹配
- "衣食之原"(Line 95,泛指民生,非服饰)
- "衣袖至于敝垢"(Line 92,引述太祖节俭,非服饰制度)
- "羊"相关匹配多为赐羊酒、马匹等,与服饰无关
- "皮"相关多为皮张物料(牛筋、马尾等),非直接服饰记载
- "环"多为人名或地名
- "织造"中与服饰无关的如"织绒"等已酌情取舍