《啸堂集古录》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 啸堂集古录 |
| 输入文件 | /home/z/my-project/upload/器物/器物/啸堂集古录.txt |
| 输出目录 | /home/z/my-project/upload/器物output/啸堂集古录/ |
| 文件总行数 | 286行 |
| 文件大小 | 约28KB |
处理流程
第1步:查总行数
wc -l → 286行
第2步:多轮grep提取服饰关键词行号
使用全部48个服饰关键词逐一检索:衣、裳、冠、带、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、环、绮、罗、纱、绢、帛、锦、绣、练、絮、布、麻、丝、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛
命中结果:
| 关键词 | 命中行号 | 命中次数 |
|---|---|---|
| 弁 | 3, 17 | 2 |
| 佩 | 3 | 1 |
| 绢 | 17 | 1 |
| 罗 | 286 | 1 |
其余44个关键词(衣、裳、冠、带、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、冕、簪、珥、环、绮、纱、帛、锦、绣、练、絮、布、麻、丝、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛)均无命中。
第3步:sed提取上下文
对命中行提取上下文(±1行),验证语境:
- 行3(提要):全文一段,约300字,含"子弁"(人名)与"佩禹字法"
- 行17(原序):全文一段,约200字,含"子弁"(人名)与"绢素"
- 行286(跋语):全文一段,约200字,含"包罗"(动词)
第4步:噪音过滤
| 关键词 | 原文 | 判定 | 过滤理由 |
|---|---|---|---|
| 弁 | 俅字子弁(行3)、王俅子弁(行17) | 噪音→过滤 | "子弁"为字(人名),非冠弁服饰 |
| 罗 | 包罗莫究(行286) | 噪音→过滤 | "包罗"为动词,囊括之意,非丝织品 |
保留记录:
| 关键词 | 原文 | 判定 | 保留理由 |
|---|---|---|---|
| 佩 | 渡水佩禹字法(行3) | 佩饰相关 | 佩带护身符俗,属佩饰范畴 |
| 绢 | 以绢素相求者(行17) | 纺织品相关 | 绢素为丝织品,虽非服饰用途但为织物 |
第5步:文件大小控制
- 啸堂集古录_总结.md:约1.5KB ✓
- 啸堂集古录_原文提取.md:约1.5KB ✓
- 啸堂集古录_日志.md:约2KB ✓
三份文件均远小于20KB上限。
处理结论
《啸堂集古录》为宋代金石学专著,以古青铜器铭文考释为全部内容,与服饰制度无直接关联。48个服饰关键词中仅4条命中,过滤噪音后仅保留2条(佩、绢),且均非服饰本义。本书服饰内容可视为近无。