《天香传》服饰内容提取日志
基本信息
| 项目 |
内容 |
| 书名 |
天香传 |
| 作者 |
北宋·丁谓 |
| 输入文件 |
/home/z/my-project/upload/器物/器物/天香传.txt |
| 输出目录 |
/home/z/my-project/upload/器物output/天香传/ |
| 总行数 |
21行(含空行) |
| 处理时间 |
2026-03-04 |
处理流程记录
步骤1:统计总行数
- 命令:
wc -l 天香传.txt
- 结果:21行
- 文本为短篇,全文可快速扫描
步骤2:服饰关键词grep检索
- 逐一检索45个服饰关键词:衣、裳、冠、带、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、环、绮、罗、纱、绢、帛、锦、绣、练、絮、布、麻、丝、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛
命中结果:
| 关键词 |
行号 |
原文片段 |
| 冠 |
14 |
如峨冠凤 |
| 带 |
12 |
黄白而带黑 |
| 带 |
19 |
香中带石末者 |
| 练 |
15 |
如练凝漆 |
未命中关键词(42个):衣、裳、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、环、绮、罗、纱、绢、帛、锦、绣、絮、布、麻、丝、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛
步骤3:上下文提取
- 对命中的第12、14、15、19行,提取完整段落上下文
- 原文为短篇,段落即为行文
步骤4:噪音过滤
- "带"(第12行、第19行):两处均为动词"含有、带有"义,与服饰腰带无关,判定为噪音,过滤
- "冠"(第14行):比喻用法(峨冠凤),但"冠"在此保留其冠帽本义作为修饰语,列为有效
- "练"(第15行):比喻用法(如练凝漆),"练"保留其丝织品本义,列为有效
步骤5:输出文件生成
- 天香传_总结.md(≤20KB ✓)
- 天香传_原文提取.md(≤20KB ✓)
- 天香传_日志.md(≤20KB ✓)
关键判定
| 判定项 |
结果 |
| 本书是否为服饰文献 |
否,为香料专论 |
| 服饰关键词有效命中数 |
2(冠、练) |
| 噪音过滤数 |
1(带,2处动词用法) |
| 有效命中是否为服饰本体记述 |
否,均为比喻/形容用法 |
| 服饰文献价值 |
极低 |