瓶史 服饰提取日志

基本信息

处理流程记录

第一步:总行数统计

wc -l 瓶史.txt → 29行

第二步:关键词逐项grep

使用48个服饰关键词逐一检索,结果如下:

关键词 是否命中 命中行号
7
7, 21
21
9
28
11
7
13
19
19
27

命中关键词:衣、冠、簪、环、罗、帛、锦、布、绡、帷、帐,共12个(含噪音) 未命中关键词:36个

第三步:上下文提取与噪音过滤

逐条审查12个命中关键词的上下文,判定是否为服饰实指:

# 关键词 行号 原文片段 判定 理由
1 7 御衣黄 有效(间接) "御衣"指帝王袍服,花色如御衣之黄
2 7 冠群芳 噪音 动词,冠绝之意
3 21 郭冠军 噪音 人称号,非冠帽
4 21 玉簪(×2) 有效(间接) 花名,以发簪喻花形
5 9 玉环 噪音 杨玉环人名
6 28 罗虬 噪音 人名
7 11 裂帛湖 噪音 地名
8 7 紫锦、锦边 有效(间接) 花品名,以锦缎喻花色
9 13 布置 噪音 动词,安排之意
10 19 轻绡护之 有效(直接) 薄丝纱,织物实物
11 19 垂帘下帷 有效(直接) 帷帐,室内织物陈设
12 27 算帐 噪音 算账之意,非帷帐

第四步:汇总统计

第五步:输出文件生成

文件 大小限制 实际 状态
瓶史_总结.md ≤20KB <5KB
瓶史_原文提取.md ≤20KB <8KB
瓶史_日志.md ≤20KB <6KB

结论

《瓶史》为插花专书,服饰内容极少。全书29行中,仅5个关键词与服饰有直接或间接关联,其中直接织物/帷帐用例仅2条(绡、帷),其余3条为花品名借称服色或饰物。服饰关联度极低,符合该书以花艺为核心的内容定位。