蜀锦谱·处理日志

处理时间:2026-03-05
输入文件:/home/z/my-project/upload/器物/器物/蜀锦谱.txt
输出目录:/home/z/my-project/upload/器物output/蜀锦谱/


一、文件基本信息

项目
书名 蜀锦谱
作者 元·费著
总行数 27行
文件大小 约2KB
文本特征 全文为短篇谱录,无分卷,行文紧凑

二、关键词grep执行记录

第一轮:衣冠裳带类(衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环)

第二轮:丝帛织物类(绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂)

第三轮:旗帜帷帐类(黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛)


三、关键词命中汇总

关键词 命中次数 命中行号 备注
73 2,4,5,6,7,8,9,10,11,12,13,14,15,16,17,19,23,25,26,27 全书核心词
1 4 锦帛
1 4 织造原料
1 4 练染工序
1 4 锦绫
1 4 衣衫

词库48关键词中命中6个,未命中42个。

未命中:裳、冠、带、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、环、绮、罗、纱、绢、绣、絮、布、麻、绸、缎、缯、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛


四、上下文提取执行记录

因全文仅27行,所有关键词行均在可视范围内,无需额外sed提取上下文。直接以全文为对象进行逐行标注提取。


五、噪音过滤记录

待过滤项 位置 处理决定 理由
"锦官"(官署名) 第4行 保留 虽为机构名,但与锦帛管理制度直接相关
"濯锦"(江名) 第4行 保留 为蜀锦文化渊源之证
"锦院"(机构名) 多行 保留 织锦管理机构,与锦帛生产制度相关
"段子"(非缎字) 第27行 保留并注 "紫皂段子"即缎子,为缎之异写,附注说明

六、词库外服饰相关条目

以下条目不含词库关键词,但与服饰丝织直接相关,已附列于原文提取末尾:

  1. 袄子(第10行):臣僚袄子锦——"袄子"为官服外套
  2. 被褥(第4、19、21、23行):丝织寝具
  3. 段子(第27行):即缎子
  4. 椅背(第21行):双连椅背、单椅背——椅披类丝织品
  5. 衣衫(第4行):泛指服饰

七、输出文件校验

文件名 大小约束 实际大小 状态
蜀锦谱_原文提取.md ≤20KB ~7KB 合规
蜀锦谱_总结.md ≤20KB ~6KB 合规
蜀锦谱_日志.md ≤20KB ~4KB 合规

总输出 < 1MB,符合严控要求。


八、处理备注

  1. 《蜀锦谱》全文仅27行,为短篇专谱,关键词高度集中于"锦"一字(73次),其余服饰关键词极少出现,这与其作为锦品名色谱录的性质一致——本书重在著录品种而非描写服制。
  2. 词库"缎"字未直接命中,但第27行"紫皂段子"之"段子"实为缎之异写,已在原文提取与总结中注明。
  3. "臣僚袄子锦"中"袄子"为词库外服饰词,但直接关联官员服制,已做特别标注。
  4. 全文无分卷,grep操作仅一轮即可覆盖全部行,无需多轮迭代。