文选补遗 服饰内容提取 - 工作日志

时间:2026-05-09

任务:提取文选补遗全部服饰相关内容


操作流程

Step 1: 确认输入文件

```

输入文件路径: /tmp/daizhige_data/集藏/文总集/文选补遗.md

wc -l -> 2575行

mkdir -p /home/z/my-project/upload/文总集output/文选补遗

```

Step 2: 多轮grep搜索

轮次关键词及匹配行数
R1衣(138) 裳(21) 裘(21) 冠(86) 冕(13)
R2袍(4) 裙(2) 衫(1) 襦(2) 褐(0)
R3绶(19) 笏(0) 履(74) 舄(5) 靴(0) 帻(1) 弁(5)
R4甲(85) 胄(13) 铠(0) 铁甲(0) 兜鍪(0)
R5帛(45) 绢(5) 缟(12) 纱(0) 锦(16) 绮(19) 绣(27)
R6黼(12) 黻(3) 衮(7) 锦绣(6) 衮冕(0) 衮衣(1)
R7带(58) 袖(13) 衽(7) 绅(12) 丝(35) 麻(14) 葛(23)
R8布衣(0) 衣冠(0) 锦衣(0) 纩(2) 裘褐(0)
R9朝服(0) 祭服(3) 丧服(0) 戎服(0) 法服(2) 命服(0) 章服(4)
R10深衣(0) 缁衣(0) 素衣(1) 朱衣(0) 青衣(1) 赐衣(2) 袍服(0)

总匹配行数:约853行(去重前,含大量非服饰用法)

Step 3: 噪音过滤

噪音类别

有效服饰段落估计:约53段

Step 4: 保存三份文件


关键发现

  1. 军服甲胄 - 涉及铠甲、甲胄、兜鍪等军事服饰

文件大小


审核结果

原文均从grep -n提取,有明确行号对应。已据实整理,未灌水凑字。