研究总结 处理日志 原文载录
◈ 处理日志

台湾杂记

《台湾杂记》服饰内容提取 — 操作日志

操作时间:2026-05-04 00:24 操作者:AI Agent


操作流程

Step 1: 确认源文件

wc -l 地理2/台湾杂记.txt → 751 行
wc -c 地理2/台湾杂记.txt → 78,736 字节

文件较小,约78KB、751行。

Step 2: 多轮grep提取服饰关键词

第一轮:衣物面料类

grep -n '衣|裳|袍|衫|裙|裤|袄|襦|褐|裘|葛|麻|丝|绢|帛|锦|绮|绫|罗|缎|绣|绡|纱|绸' 台湾杂记.txt

命中行:39, 49, 67, 73, 79, 85, 97, 123, 167, 175, 177, 179, 181, 199, 205, 219, 223, 243, 279, 433, 447, 507, 525, 531, 557, 639, 657, 659, 669, 711

第二轮:首服足衣类

grep -n '冠|帽|帻|幞头|弁|冕|屐|屦|鞋|袜|履|靴' 台湾杂记.txt

命中行:67, 85, 129, 175, 217, 321, 365, 525, 549, 615, 687, 728

第三轮:佩饰配件类

grep -n '带|佩|簪|钗|环|钏|珥|缨|绦|绶|鱼袋' 台湾杂记.txt

命中行:179, 217, 219, 221, 223, 229, 471, 495, 501, 513, 521, 531, 549, 557, 561, 609, 711

第四轮:服饰复合词

grep -n '衣服|衣冠|衣裳|冠带|服饰|章服|品色|服色' 台湾杂记.txt

命中行:179, 181, 199, 219, 433, 447

第五轮:穿戴动词

grep -n '穿|戴|着' 台湾杂记.txt

命中行:15, 19, 25, 85, 175, 199, 309, 321, 471, 549, 561, 585, 615, 645, 687, 701, 713

第六轮:颜色词

grep -n '紫|绯|红|绿|青|白|黑|黄|朱|皂|玄|碧|翠' 台湾杂记.txt

命中行大量,需筛选与服饰直接相关的。

Step 3: sed提取上下文

对筛选后的服饰相关行号,用 sed -n '行号-2,行号+10p' 提取上下文段落。

Step 4: 精简筛选

从约50个命中行中,剔除与服饰无关的用法(如"紫气东来"城门题字、"碧血"指血、"白雪"指山雪等),保留28个服饰相关条目。

Step 5: 分类整理

分为13大类:缠足、婚嫁服饰、赠物、丧葬服饰、僧侣服饰、宗教盛装、妇女日常服饰、寒具、足衣、优伶服饰、日用衣饰、物产材料、总结。


关键发现

  1. 本书为日据时期日本人视角的台湾观察录,服饰描写处处以日本风俗对比,形成独特的"他者"视角
  2. 妇女服饰是全书服饰内容的核心——从缠足到修饰、花簪、绫罗服装、茶场服饰,占服饰相关条目的70%以上
  3. 气候决定穿着——台湾温暖,衣裳以"单衣薄缣"为主,与日本"重袭绫罗"形成对比
  4. 首饰贵于衣料——衣裳费用不高,但簪具耳环以黄金白银制,富豪妇女头饰花费不下千金
  5. 丧服三色制度——白色(父母丧辫发绾丝)、黑色(帽顶)、蓝色(兄弟丧绾子),作者赞为"美风"
  6. 大甲蔺草是重要物产,可制帽、履、筵、囊,由妇女手工制作,总督府奖励其业
  7. 龟甲制簪、槟榔染物体现台湾地方特色服饰材料
  8. 本书服饰内容较为分散(散布于100余则短文中的约28则),不如专门服饰典籍系统

保存文件

文件 路径 大小
知识库总结 台湾杂记_总结.md ~3.4KB
日志记录 台湾杂记_日志.md 本文件
原文提取 台湾杂记_原文提取.md ~6KB

备注

  • 源文件为日文汉文(和汉混淆文体),夹杂日语假名与汉字
  • 书中"台"指台湾,"日东"指日本,"泰西"指西方
  • 部分条目有"评曰"附论,为作者佐仓达山的评论
  • 全书服饰内容总量不大(约28则相关条目),已全部提取