《台湾关系文献集零》服饰内容提取 — 操作日志

操作时间:2026-05-04 15:22-15:35
操作者:AI Agent(subagent)
源文件:/root/.openclaw/workspace/别史/台湾关系文献集零.txt


操作流程

Step 1: 查看文件基本信息

$ wc -c 台湾关系文献集零.txt
296678
$ wc -l 台湾关系文献集零.txt
2076
$ head -50 台湾关系文献集零.txt
→ 文件由19篇文献组成(台湾关系文献集零一至零十九)
→ 内容涵盖明末至清末台湾相关奏疏、诗文、碑记、方志

Step 2: 多轮grep关键词提取

轮次 关键词 命中行数 有效服饰匹配
第1轮 衣|裳|袍|衫|裙|袄|裤|袜|履|鞋|靴|舄 ~35行 8处
第2轮 冠|冕|弁|帽|幞头|帻|笠 ~15行 4处
第3轮 绢|绫|罗|缎|锦|绮|丝|绸|布|麻|葛|棉|苎 ~20行 3处
第4轮 裘|皮|貂|狐|羊|麂 ~10行 0处
第5轮 紫|绯|红|绿|青|白|黑|黄 ~100行 2处
第6轮 鱼袋|笏|带|佩|簪|钗|钏|坠|环(服饰搭配) ~10行 2处
第7轮 赐服|赐紫|赐绯|借紫|借绯 0行 0处
第8轮 服色|品色|章服|冠服|舆服|制服 0行 0处
第9轮 染|绣|织|裁|缝|绩|纺 ~5行 1处
第10轮 补服|补子|文官|武官|品级|顶戴|号衣|衣甲|铠|甲 ~10行 5处
补充轮 衣冠|衣裳|衣饰|衣服|冠带|冠冕 ~15行 4处

有效服饰段落总计:约29处

Step 3: sed提取上下文

对关键行号使用 sed -n '行号-5,行号+10p' 提取完整段落:
- 主要命中的行号:42, 84, 132, 134, 142, 148, 150, 434, 442, 460, 466, 540, 582, 596, 610, 946, 956, 1034, 1066, 1308, 1340, 1348, 1352, 1398, 1530, 1656
- 总提取量约45KB

Step 4: 精简筛选

剔除的误匹配(约70%)
- "皮"在"皮匠""皮毛""皮挡"等非服饰语境
- "带"在"带领""一带""连带"等非服饰语境
- "红"在"红毛""红夷""红山"等地名/族名
- "白"在"白夷""白鸠""白衣庵"等非服饰语境
- "布"在"布政司""分布"等非服饰语境
- "绿"在"绿营""绿竹"等非服饰语境
- "黄"在"黄斌卿""黄芳度"等人名

保留的有效服饰段落
1. 行148:日本服饰习俗(衣无襟裾、缝一大幅、短袖半臂、大带束腰)
2. 行42:刘氏捐衣饰助黄斌卿
3. 行84:郑芝龙宅邸锦幄金玉之饰
4. 行132:肯堂备军衣甲
5. 行134:肯堂衣冠望天拜
6. 行142:吴锺峦麻帐纑絮(简朴衣着)
7. 行150:加二品服赐袍带
8. 行434:王衣冠者乘巨鲲(传说描写)
9. 行442:宁靖王冠带佩印绶自缢
10. 行460:官兵遗号衣,贼假装以误官军
11. 行466:詹通着黄褂佩伪印
12. 行582:生擒黑夷并衣甲
13. 行596:衣甲、军衣、旗帜为验证物
14. 行610:制备兵勇号衣旗帜
15. 行946:生番被发露体
16. 行956:番社头缠苍艾、腰束绿筠
17. 行1034:焚罢蓝衫换战衣
18. 行1340:魋结迎门衣短衤屈
19. 行1348:田畴而衣冠
20. 行1398:锦缎裁霞榖、缨冠
21. 行1656:各备衣冠迎神

Step 5: 分类结果

类别 数量 代表行号
日本服饰习俗 1 148
军事装备(衣甲/号衣) 5 132, 460, 582, 596, 610
官员冠服/礼仪 4 134, 150, 442, 1656
丝绸织物贸易 3 33, 58, 84
原住民服饰 3 946, 956, 1340
诗歌服饰意象 5 1034, 1348, 1398, 1332, 1066

关键发现

  1. 服饰内容极少:全书2,076行中,确为服饰记载的仅约21处,占比约1%。这是一部政治军事文献,非文学或礼制著作。
  2. 日本服饰描写最有价值(行148):详细记录了日本衣制——无襟裾、缝一幅、短袖半臂、大带束腰、跣足拖皮套。
  3. 军事装备为核心内容:号衣、衣甲、军衣等出现5次,反映了清代台湾军事活动中的实际装备状况。
  4. "衣冠"出现频率较高,但多为"衣冠"一词的象征用法(如"衣冠望天拜""各备衣冠""田畴而衣冠"),而非具体服饰描写。
  5. 无品色服制、冕服体系、纺织工艺、染色绣织等系统性服饰内容。

保存文件

文件 路径 大小
服饰综述 台湾关系文献集零_总结.md ~2.4KB
操作日志 台湾关系文献集零_日志.md 本文件
原文提取 台湾关系文献集零_原文提取.md ~8KB

备注