《啸堂集古录》服饰内容提取日志

基本信息

项目 内容
书名 啸堂集古录
输入文件 /home/z/my-project/upload/器物/器物/啸堂集古录.txt
输出目录 /home/z/my-project/upload/器物output/啸堂集古录/
文件总行数 286行
文件大小 约28KB

处理流程

第1步:查总行数

wc -l → 286行

第2步:多轮grep提取服饰关键词行号

使用全部48个服饰关键词逐一检索:衣、裳、冠、带、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、环、绮、罗、纱、绢、帛、锦、绣、练、絮、布、麻、丝、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛

命中结果

关键词 命中行号 命中次数
3, 17 2
3 1
17 1
286 1

其余44个关键词(衣、裳、冠、带、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、冕、簪、珥、环、绮、纱、帛、锦、绣、练、絮、布、麻、丝、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛)均无命中。

第3步:sed提取上下文

对命中行提取上下文(±1行),验证语境:

第4步:噪音过滤

关键词 原文 判定 过滤理由
俅字子弁(行3)、王俅子弁(行17) 噪音→过滤 "子弁"为字(人名),非冠弁服饰
包罗莫究(行286) 噪音→过滤 "包罗"为动词,囊括之意,非丝织品

保留记录

关键词 原文 判定 保留理由
渡水佩禹字法(行3) 佩饰相关 佩带护身符俗,属佩饰范畴
以绢素相求者(行17) 纺织品相关 绢素为丝织品,虽非服饰用途但为织物

第5步:文件大小控制

三份文件均远小于20KB上限。

处理结论

《啸堂集古录》为宋代金石学专著,以古青铜器铭文考释为全部内容,与服饰制度无直接关联。48个服饰关键词中仅4条命中,过滤噪音后仅保留2条(佩、绢),且均非服饰本义。本书服饰内容可视为近无。