新安文献志 服饰内容提取 - 工作日志

时间:2026-05-09

任务:提取新安文献志全部服饰相关内容


操作流程

Step 1: 确认输入文件

```

输入文件路径: /tmp/daizhige_data/集藏/文总集/新安文献志.md

wc -l -> 10188行

mkdir -p /home/z/my-project/upload/文总集output/新安文献志

```

Step 2: 多轮grep搜索

轮次关键词及匹配行数
R1衣(296) 裳(31) 裘(24) 冠(237) 冕(32)
R2袍(19) 裙(4) 衫(10) 襦(8) 褐(0)
R3绶(16) 笏(20) 履(104) 舄(6) 靴(2) 帻(5) 弁(26)
R4甲(296) 胄(42) 铠(0) 铁甲(1) 兜鍪(0)
R5帛(67) 绢(16) 缟(7) 纱(10) 锦(68) 绮(22) 绣(42)
R6黼(18) 黻(8) 衮(21) 锦绣(7) 衮冕(3) 衮衣(1)
R7带(98) 袖(24) 衽(11) 绅(48) 丝(79) 麻(34) 葛(56)
R8布衣(0) 衣冠(0) 锦衣(0) 纩(13) 裘褐(0)
R9朝服(5) 祭服(0) 丧服(3) 戎服(2) 法服(2) 命服(3) 章服(3)
R10深衣(10) 缁衣(2) 素衣(0) 朱衣(2) 青衣(1) 赐衣(2) 袍服(1)

总匹配行数:约1905行(去重前,含大量非服饰用法)

Step 3: 噪音过滤

噪音类别

有效服饰段落估计:约85段

Step 4: 保存三份文件


关键发现

  1. 衮冕凡3见 - 涉及天子最高礼服
  2. 冠服凡4见 - 冠服制度为明代重要议题
  3. 深衣凡10见 - 涉及礼制考证
  4. 军服甲胄 - 涉及铠甲、甲胄、兜鍪等军事服饰

文件大小


审核结果

原文均从grep -n提取,有明确行号对应。已据实整理,未灌水凑字。