《台海使槎录》服饰内容提取 — 操作日志
操作时间:2026-05-03 22:45 操作者:AI Agent (Subagent)
操作流程
Step 1: 加载参考格式
读取三份参考模板(总结.md、日志.md、原文提取.md)以确定输出格式。
Step 2: 多轮grep提取服饰关键词
第一轮:核心服饰词
grep -n '衣|裳|袍|衫|裙|裤|袄|襦|褐|裘|葛|麻|丝|绢|帛|锦|绮|绫|罗|缎|绣|绡|纱|绸' 台海使槎录.txt
→ 命中约200行(输出限制),主要集中在:
- 第30行:番俗概况(无冠履衣服之仪)
- 第245行:汉人婚礼服饰(簪珥绸帛绫绸)
- 第271行:服饰俚语(龙摆尾、凤点头)
- 第279行:鸦片烟(麻葛相关)
- 第311行:海船贸易丝织品
- 第315行:荷兰贡物(哆啰绒、织金绒毯、乌羽缎等)
- 第507行:采硫纪行(衣染硫气)
- 第581行:朱一贵之乱服饰(幞头蟒服)
- 第605-1300行:番俗六考各社衣饰(核心区域)
第二轮:冠帽鞋履词
grep -n '冠|帽|帻|幞头|弁|冕|屐|屦|鞋|袜|履|靴' 台海使槎录.txt
→ 命中约100行,主要集中在:
- 第30行:无冠履衣服之仪
- 第245行:冠笄礼仪
- 第581行:冠不足或以红绿绸裹头
- 第583行:头戴明帽身穿清衣
- 第681行:戴帽着靴
- 第853行:以皮为帽
- 第934行:皮帽皮鞋
- 第1026行:竹节帽、皁鞋、绒帽
- 第1070行:戴高冕
- 第1148行:戴帽编辫、着履
- 第1218行:豹皮帽、头箍
第三轮:首饰配件词
grep -n '带|佩|簪|钗|环|钏|珥|缨|绦|绶|鱼袋' 台海使槎录.txt
→ 命中约100行,主要集中在:
- 第245行:簪珥、银簪
- 第619行:璎珞、臂钏、手圈
- 第681行:铁镯环
- 第723行:铁钏、蛤钏
- 第725行:木梳、竹簪、螺簪、鹿角簪
- 第805行:珠串、铜圈
- 第881行:纱头箍、项挂衣堵、眉打喇
- 第978行:骨簪、立项带、牙堵、夏力什素
- 第1026行:哈达(白螺壳方块)、竹圈、螺钱
- 第1086行:玛瑙珠、螺钱、草珠
- 第1148行:铜镯铁环、圭留
- 第1218行:豹皮帽、头箍、鸟羽
第四轮:颜色词
grep -n '紫|绯|红|绿|青|白|黑|黄|朱|皂|玄|碧|翠' 台海使槎录.txt
→ 大量命中(颜色词在番俗描述中极常见),筛选服饰相关:
- 第619行:衣黑白不等、茜毛织以红纹、乌布
- 第681行:艳服、金丝藤
- 第723行:茜毛织红纹、乌布蔽体
- 第805行:衣皆白色
- 第881行:杂色绸纻红袄、白狮犬毛
- 第1026行:红丝带、乌丝线
- 第1148行:青布围腰、青布缠头
- 第1218行:朱英、豹尾、红绿卓戈纹
Step 3: sed提取上下文
对关键行号使用 sed -n '行号-2,行号+10p' 提取上下文,共提取约30个关键片段,总计约15KB原始文本。
Step 4: 精简控制
所有提取片段经人工筛选,仅保留与服饰直接相关的内容,剔除无关地理、物产、兵防内容。最终精简至约12KB有效文本。
Step 5: 分类整理
分为以下服饰类别:
- 基本衣制(笼仔、■〈衤曼〉、达戈纹等)
- 各社衣饰差异(十余社对比)
- 冠帽头饰(竹节帽、豹皮帽、头箍等)
- 首饰配件(耳饰、颈饰、手足饰)
- 丧服制度(乌布丧服、白布丧服等)
- 婚嫁服饰(汉人婚礼、番人婚嫁)
- 军旅服饰(郑氏甲冑、朱一贵戏服)
- 纺织材料与贸易(苎麻、鹿皮、丝织品贸易)
- 服饰与教化(番汉服饰融合)
关键发现
- 番俗六考是服饰记载的核心:全书服饰内容80%以上集中在番俗六考部分,覆盖北路诸罗番十社、南路凤山番、傀儡生番等
- 达戈纹是台湾番布的代表:各社普遍使用,但土官家方可织特定颜色和花纹
- 服饰命名体系独特:每个番社对服饰有独特的番语命名(笼仔、■〈衤曼〉、卓戈纹、包练、几辘等),具有极高的语言学价值
- 丧服色尚差异:大部分社以乌布为丧服,阿里山等社尚白色,傀儡番衣白褂围白布——反映不同族群的丧葬文化差异
- 汉化服饰渐变:从"无冠履衣服之仪"到"衣裈半如汉人",书中完整记录了清代台湾原住民的服饰汉化进程
- 朱一贵之乱的服饰轶事极为生动——叛军以戏服僭越、以书籍絮甲,童谣"头戴明帽身穿清衣"预言平乱
- 郑成功军旅禁止穿靴履的水师特色,与海岸地理环境直接相关
保存文件
| 文件 | 路径 | 大小 |
|---|---|---|
| 总结 | 地理2output/台海使槎录/台海使槎录_总结.md | ~3.7KB |
| 日志 | 地理2output/台海使槎录/台海使槎录_日志.md | ~5KB |
| 原文提取 | 地理2output/台海使槎录/台海使槎录_原文提取.md | ~15KB |
备注
- 《台海使槎录》版本基于殆知阁收录本
- 原文中有较多生僻字/异体字(如■〈衤曼〉、■〈沙上毛下〉等),保留原貌
- 番语服饰名称(如宾耶产、描打腊、沙其落等)均据原文录入
- 全文服饰相关片段约15KB,控制在1M限制内