《晁氏墨经》服饰内容提取日志

基本信息

处理流程

第一步:统计总行数

wc -l → 62行

文件较短,为宋代制墨技术专书。

第二步:多轮grep提取服饰关键词

第一轮衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅

行号 命中词 原文片段 判定
8 窑衣露虫杂在煤中 ❌噪音:"窑衣"为窑体覆盖物,非服饰
11 直至一条如带为度其脉 ⚠️比喻:以带喻胶液黏稠度,非服饰本体
35 又有以衣被覆之使乾者 ✅有效:衣被即衣物被褥
56 时置于衣袖中 ✅有效:衣袖即衣裳之袖

第二轮弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布

行号 命中词 原文片段 判定
5 罗山之松 ❌噪音:罗山为地名,非丝织品
13 凡煤须用罗 ❌噪音:罗为筛具,非丝织品
14 当以细绢筛堈(网)内 ✅有效:绢为丝织筛网材料

第三轮麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛

行号 命中词 原文片段 判定
11 煎法用蜡及胡麻者 ❌噪音:胡麻即芝麻,非麻布

第三步:噪音过滤说明

噪音条目 关键词 排除理由
"罗山之松"(第5行) 罗山为山名,与丝织品"罗"无关
"窑衣露虫"(第8行) 窑衣为窑内附着物术语,非衣裳之衣
"胡麻者"(第11行) 胡麻为芝麻,非麻类织物
"凡煤须用罗"(第13行) 罗为筛分工具(动词/名词),非丝织品罗

第四步:有效提取汇总

序号 行号 关键词 章节 原文核心句 类别
1 14 醇烟捣讫,当以细绢筛堈(网)内 丝织筛具
2 35 又有以衣被覆之使乾者 衣物覆盖
3 56 养蓄 时置于衣袖中,弥善 衣袖收纳

输出文件

  1. 晁氏墨经_总结.md(≤20KB)
  2. 晁氏墨经_原文提取.md(≤20KB)
  3. 晁氏墨经_日志.md(≤20KB,即本文件)