《玉纪》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 玉纪 |
| 作者 | 江阴陈性(原心) |
| 输入文件 | /home/z/my-project/upload/器物/器物/玉纪.txt |
| 输出目录 | /home/z/my-project/upload/器物output/玉纪/ |
| 文件总行数 | 36行 |
| 处理时间 | 2026-03-04 |
处理流程
第一步:wc -l 查总行数
wc -l /home/z/my-project/upload/器物/器物/玉纪.txt
→ 36 /home/z/my-project/upload/器物/器物/玉纪.txt
全书仅36行,属短篇古籍。
第二步:多轮grep -n提取服饰关键词行号
使用服饰关键词词库(46个关键词)逐一grep,结果如下:
| 关键词 | 命中行号 | 命中次数 |
|---|---|---|
| 衣 | 16 | 1 |
| 带 | 27 | 1 |
| 佩 | 6, 12 | 4 |
| 锦 | 6 | 1 |
| 絮 | 6 | 1 |
| 布 | 12, 29 | 3 |
| 丝 | 23 | 1 |
其余39个关键词(裳、冠、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、环、绮、罗、纱、绢、帛、绣、练、麻、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛)均未命中。
共7个关键词命中,累计11次出现。
第三步:sed -n提取上下文
对命中的第6、12、16、23、27、29行,提取完整行内容,逐一审查上下文语义。
第四步:过滤噪音
对11次命中逐条判定是否为服饰用义:
| 关键词 | 行号 | 原文片段 | 语义判定 | 处理 |
|---|---|---|---|---|
| 衣 | 16 | 此青衣之色 | 以衣色喻玉色,"青衣"指深色衣裳 | 保留 |
| 佩 | 6 | 乞玉以为佩 | 玉佩,佩戴于身的饰物 | 保留 |
| 佩 | 6 | 佩之弗敢火 | 佩戴在身 | 保留 |
| 佩 | 12 | 佩之益人性灵 | 佩戴玉器 | 保留 |
| 佩 | 12 | 佩之利人精神 | 佩戴玉器 | 保留 |
| 带 | 27 | 沿海一带 | 地理范围词 | 剔除 |
| 锦 | 6 | 《千金集锦》 | 书名 | 剔除 |
| 絮 | 6 | 白雾如絮 | 比喻词 | 剔除 |
| 布 | 12 | 番音曰:"白布" | 地名简称 | 剔除 |
| 布 | 29 | 用旧白布轻轻擦之 | 工具用布 | 剔除 |
| 布 | 29 | 再换新白布 | 工具用布 | 剔除 |
| 丝 | 23 | 镶嵌金丝宝石 | 工艺用语 | 剔除 |
过滤后有效命中:5次(衣1次、佩4次),涉及2个关键词。
另补充间接服饰关联2处(第12行"裹身"、第29行"贴身"),虽未命中关键词,但与服饰佩戴相关,列入原文提取附注。
第五步:生成输出文件
| 文件名 | 大小 | 内容 |
|---|---|---|
| 玉纪_总结.md | <20KB | 服饰内容分析总结 |
| 玉纪_原文提取.md | <20KB | 命中原文及上下文 |
| 玉纪_日志.md | <20KB | 本日志 |
统计摘要
- 全书总行数:36行
- 关键词库总量:46个
- 命中关键词数:7个
- 命中总次数:11次
- 噪音剔除次数:6次
- 有效服饰命中次数:5次
- 有效服饰关键词数:2个(衣、佩)
- 间接关联补充:2处(裹身、贴身)
结论:《玉纪》为古玉鉴赏专书,服饰关联度极低,仅"衣""佩"二字涉及服饰内容,且"衣"仅作比喻用,"佩"为本书核心概念(玉佩佩戴),服饰内容为旁涉性质。