《清一统志·台湾府》服饰内容提取 — 操作日志
操作时间:2026-05-03 18:52 操作者:AI Subagent
操作流程
Step 1: 读取参考格式
读取三份参考文件,了解输出格式要求:
- 参考/总结.md → 汇编式总结,按主题分类
- 参考/日志.md → 操作流程记录
- 参考/原文提取.md → 原文片段分类整理
Step 2: 多轮grep提取
第一轮:衣料/织物类关键词
grep -n '衣\|裳\|袍\|衫\|裙\|裤\|袄\|襦\|褐\|裘\|葛\|麻\|丝\|绢\|帛\|锦\|绮\|绫\|罗\|缎\|绣\|绡\|纱\|绸'
→ 命中行数:约150行
→ 主要集中区域:619-637行(番民服饰记载)
→ 次要区域:29行(风俗)、411行(天后庙神像衣湿)、555行(衣不解带)、583行(绛衣缟衣仙)、677行(绫缎杂缯贸易)、755行(华人衣冠画轴)、759行(谨衣袽者念之哉)
第二轮:冠履类关键词
grep -n '冠\|帽\|鞋\|袜\|履\|靴'
→ 命中行数:约15行
→ 有效服饰行:627行(戴竹节帽)、631行(履险如平)、755行(投帽于地、华人衣冠)
→ 其余为地名或非服饰用法
第三轮:饰品类关键词
grep -n '带\|佩\|簪\|钗\|环\|钏\|珥\|缨\|绦\|绶'
→ 命中行数:约60行
→ 有效服饰行:619行(铜铁环束两腕)、621行(腕束铜环、簪野花)、627行(腰围幅布)
→ 其余为地名(角带围山)、城池(环植刺竹)等非服饰内容
第四轮:复合服饰词
grep -n '衣服\|衣冠\|衣裳\|冠带\|服饰\|章服\|品色\|服色'
→ 命中行数:约5行
→ 有效行:755行(华人衣冠)、765行(一衣带水,非服饰)
第五轮:颜色词
grep -n '紫\|绯\|红\|绿\|青\|白\|黑\|黄\|朱\|皂\|玄\|碧\|翠'
→ 命中行数:约200行
→ 有效服饰相关行:619行(红帛)、627行(朱绳、白螺)、633行(五色狗毛杂树皮,陆离如锦)、583行(绛衣、缟衣)、755行(赤须朱发)
→ 其余为地名(红毛寮)、物产(红柑、青鱼)、颜色描写(苍翠、翠巘)等
Step 3: sed提取上下文
对关键行号使用sed提取完整段落:
sed -n '27,31p' → 风俗总论(布帛多资于中土)
sed -n '409,413p' → 天后庙(神像衣湿)
sed -n '553,557p' → 李宋妻赵氏(衣不解带)
sed -n '581,585p' → 绛衣缟衣仙
sed -n '617,640p' → 番民服饰核心区(12段)
sed -n '675,679p' → 绫缎杂缯贸易
sed -n '753,757p' → 红毛番(华人衣冠画轴)
sed -n '757,761p' → 红毛番续(赤须朱发、投帽于地)
sed -n '759,761p' → 谨衣袽者念之哉
Step 4: 精简与筛选
从grep命中结果中,筛选出与服饰直接相关的片段:
- 有效服饰片段:约15段
- 总字数控制在≤20KB
- 排除了地名中含关键词但非服饰的内容
Step 5: 分类整理
将提取的服饰内容分为以下类别:
- 番民服饰(按族群分9组)
- 汉族服饰与布帛贸易
- 海外夷人服饰(红毛番)
- 服饰与社会文化
关键发现
- 服饰是族群标识的核心要素:不同番民群体的服饰差异显著,从裸体到布衣形成完整阶梯
- 衣料来源反映经济形态:树叶→树皮→鹿皮→毡→布帛,对应渔猎→采集→贸易的经济演进
- 汉化过程可从服饰观察:着布衫、戴竹节帽等表明部分番民已接受汉族服饰文化
- 鹿皮是最重要的番民衣料:几乎所有番民群体都使用鹿皮蔽体
- "衣不解带"为唯一汉族服饰描写:反映节烈故事中的服饰意象
- 红毛番有穿华人衣冠的传统:画轴记载表明中荷文化交流
- "谨衣袽者念之哉":以衣袽(破衣)比喻戒慎之心,为全书服饰相关的点睛之语
保存文件
| 文件 | 路径 | 大小 |
|---|---|---|
| 总结 | 清一统志台湾府_总结.md | ~3KB |
| 日志 | 清一统志台湾府_日志.md | 本文件 |
| 原文提取 | 清一统志台湾府_原文提取.md | ~12KB |
备注
- 《清一统志·台湾府》为清代官修地理总志,服饰记载集中于"番民"部分
- 全书服饰内容不多但信息密度高,涵盖9个番民群体的服饰描写
- 与文学作品不同,地理志书的服饰描写以实录性为主,少有铺陈渲染
- 服饰相关关键词在全书中的分布较为集中,主要在619-637行(番民章节)