《陶说说今篇》服饰内容提取日志
基本信息
- 书名:陶说说今篇
- 输入文件:/home/z/my-project/upload/器物/器物/陶说说今篇.txt
- 输出目录:/home/z/my-project/upload/器物output/陶说说今篇/
- 处理时间:2026-03-05
- 文件总行数:118行
第一轮:关键词全表扫描
使用服饰关键词词库(47字)对全文逐字grep,初步命中如下:
| 关键词 | 命中行号 | 命中次数 |
|---|---|---|
| 环 | 8, 118 | 2 |
| 簪 | 10 | 1 |
| 罗 | 52 | 1 |
| 绢 | 26 | 1 |
| 纱 | 88 | 1 |
| 锦 | 84 | 1 |
| 布 | 26, 56, 100 | 3 |
| 麻 | 20 | 1 |
| 丝 | 80, 92 | 2 |
| 带 | 100 | 1 |
未命中关键词:衣、裳、冠、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、珥、佩、绮、帛、绣、练、絮、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛
初步命中总计:10个关键词,11条记录
第二轮:逐条噪音研判
| # | 关键词 | 行号 | 原文片段 | 判定 | 理由 |
|---|---|---|---|---|---|
| 1 | 环 | 8 | 为连环为互 | ❌噪音 | "连环"指印章纽式(连环纽),非服饰环佩 |
| 2 | 环 | 118 | 山环水绕 | ❌噪音 | 地理描写,"环"为动词"环绕" |
| 3 | 簪 | 10 | 搔头簪 | ✅有效 | 陶瓷制发簪,属首饰类服饰配件 |
| 4 | 罗 | 52 | 宋四罗六罗 | ❌噪音 | 碗碟样式名(罗=器型分类),非罗纱织物 |
| 5 | 绢 | 26 | 双层绢袋 | ❌噪音 | 淘泥过滤工具用绢袋,非服饰用绢 |
| 6 | 纱 | 88 | 口蒙细纱 | ❌噪音 | 吹釉竹筒口蒙细纱,工具配件,非服饰用纱 |
| 7 | 锦 | 84 | 取样于锦段 | ✅有效 | 织锦纹样为瓷器彩画取样本源 |
| 8 | 布 | 26 | 细布大单 | ❌噪音 | 包泥吸水用布,非服饰 |
| 9 | 布 | 56 | 用布包泥 | ❌噪音 | 制坯工具用布,非服饰 |
| 10 | 布 | 100 | 用布十数层制手套、湿布包裹 | ❌噪音 | 窑工开窑防护用具,非服饰 |
| 11 | 麻 | 20 | 麻仓山 | ❌噪音 | 地名(浮梁麻仓山产瓷土),非麻布 |
| 12 | 丝 | 80 | 慌涷丝 | ✅有效 | 引《考工记》涷丝工艺,属丝织加工 |
| 13 | 丝 | 92 | 丝绵 | ❌噪音 | 旋坯工具垫材(包以丝绵),非服饰用丝 |
| 14 | 带 | 100 | 带紫红色、带潮 | ❌噪音 | 动词"带有/携带",非腰带服饰 |
有效条目:3条(簪、丝、锦)
噪音条目:11条
第三轮:上下文提取与验证
对3条有效记录提取上下文(前后各2行),并二次grep验证原文准确性:
验证1:簪(第10行)
$ rg -n "簪" 陶说说今篇.txt
10: 罂钵拌案可充日用搔头簪尊合欢之珰大小合于香泽粉黛之所储藏可供闽詹至于
✅ 确认"搔头簪""合欢之珰"为陶瓷首饰,珰虽不在词库中但与簪同属首饰类。
验证2:丝(第80行)
$ rg -n "涷丝" 陶说说今篇.txt
80: ……慌涷丝筐人阙……
✅ 确认"涷丝"为《考工记》设色五工之一,属丝织工艺。
验证3:锦(第84行)
$ rg -n "锦段" 陶说说今篇.txt
84: ……其大半取样于锦段……今瓷画样十分之则洋彩得四写生得三仿古二锦段一也
✅ 确认"锦段"指织锦纹样,为瓷器彩画取样本源。
输出文件清单
| 文件名 | 大小 | 说明 |
|---|---|---|
| 陶说说今篇_总结.md | ≤20KB | 服饰内容总结分析 |
| 陶说说今篇_原文提取.md | ≤20KB | 服饰相关原文及上下文 |
| 陶说说今篇_日志.md | ≤20KB | 本处理日志 |
统计汇总
| 项目 | 数值 |
|---|---|
| 文件总行数 | 118 |
| 服饰关键词词库字数 | 47 |
| 初步命中关键词数 | 10 |
| 初步命中记录数 | 11+2(丝)=14 |
| 噪音过滤后有效条目 | 3 |
| 涉及服饰关键词 | 簪、珰(附)、丝、锦 |
| 未命中关键词数 | 37 |