《刘铭传抚台前后档案》服饰内容提取 · 处理日志
时间:2026-05-05 任务:提取《刘铭传抚台前后档案》全部服饰相关内容,整理分类总结
操作流程
Step 0: 创建输出目录
mkdir -p /root/.openclaw/workspace/诏令奏议output/刘铭传抚台前后档案/
Step 1: 检查文件大小
wc -c /root/.openclaw/workspace/诏令奏议/001/刘铭传抚台前后档案.txt
→ 447652 bytes (447KB)
→ 未超500KB阈值,但仍用grep+sed提取,严禁整本载入
Step 2: 初次grep(宽泛关键词)
grep -n "舆服\|冠\|冕\|袍\|绶\|朝服\|祭服\|公服\|服色\|章服\|戎服\|赐紫\|赐绯\|衣\|裳\|裘\|帛\|锦\|绣\|丝\|绢\|绫\|罗\|缎\|褐\|布\|染\|色\|带\|佩\|笏\|靴\|履\|帽\|巾\|帻\|簪\|钗\|首饰\|服饰\|车服\|冕服\|法服\|冠服\|品服\|命服\|丧服\|婚礼\|昏服"
→ 166条结果
问题:大量噪音——
- "巾老耶"(地名,非服饰)
- "丝"(银两单位"四丝",非纺织品)
- "布"("布置"之布,非布疋)
- "帽"("草帽"出现于硫磺贸易段落)
Step 3: 精确grep(二次筛选)
grep -n "衣裤\|衣裳\|薙发\|剃发\|易服\|变服\|辫线\|蓝布\|哔叽\|赏给.*衣\|赏给.*裤\|衣、裤\|蟒袍\|顶戴\|赏加\|黄马褂\|朝珠\|补服\|翎枝\|花翎\|蓝翎\|红顶\|顶子\|品服\|冠服\|衣冠\|军装\|号衣\|号褂\|制服\|军服\|皮冠\|帽\|靴\|袜\|鞋\|袍\|褂\|裘\|缎\|绸\|锦\|绣\|染"
→ 进一步筛选出有效段落
Step 4: 提取上下文并验证
对关键段落用sed提取前后5-10行上下文,确认原文存在并标注行号。
关键段落识别:
- 行254:抚番善后章程——薙发令、赏给粗布上下衣、剃头刀
- 行890-900:嘉义县招抚——赏给蓝布衫、红哔叽裤腿、辫线、剃刀
- 行410-420:南路抚番——赏以布疋、银炼、玛瑙珠
- 行1948-1954:中心仑等四十三社社长春秋衣裤96套
- 行2030-2034:牡丹社番童番勇月给伙食衣裤
- 行1432-1445:内山番社薙发管理、功牌制度
- 行2524-2532:全台大规模薙发奏疏
- 行1808:吕家望攻克赏赐——黄马褂、头品顶戴、花翎
- 行1800:全台归化赏赐——花翎、巴图鲁名号
- 行928-936:沈应奎赏还原衔花翎
Step 5: 去噪结果
保留的有效段落:
- 薙发易服制度(抚番善后章程、各处招抚实例)
- 赏番衣裤(蓝布衫、红哔叽裤腿、春秋衣裤)
- 抚番赏赐中的纺织品(布疋)
- 军功赏赐服饰(黄马褂、花翎、顶戴)
- 番目功牌制度
排除的噪音:
- 巾老耶(地名)
- 丝(银两单位)
- 布置、分布等动词用法
- 军装器具(火药、军械,非服饰)
- 硫磺贸易中的草帽(非服饰制度内容)
- 染疫(疾病,非染色)
Step 6: 产出三份文档
- 刘铭传抚台前后档案_总结.md(2.8KB)
- 刘铭传抚台前后档案_日志.md(本文件)
- 刘铭传抚台前后档案_原文提取.md
关键发现
- 本书无传统舆服制度记载:全书为晚清台湾治台公文,无冕服、朝服、祭服等内容
- 服饰内容集中于"薙发易服":这是清代治台抚番政策的核心标志
- 赏番衣裤已制度化:社长春秋衣裤年发两次,有明确的规模和流程
- 蓝布衫、红哔叽裤腿为标准赏番服饰:光绪十二年嘉义县招抚实例
- 军功服饰赏赐(黄马褂、花翎)出现于上谕中:为攻克番社后的论功行赏
- 功牌制度与服饰相关:番目归化一年不滋事者给六七品功牌
审核结果
全部通过 ✅ — 原文均从原文件中grep+sed提取,有明确行号对应。