禹贡论 服饰内容提取日志
基本信息
- 任务ID:1-51
- 文件路径:/home/z/my-project/upload/尚书/尚书/禹贡论.txt
- 文件规模:848行
- 输出目录:/home/z/my-project/upload/尚书output/禹贡论/
关键词搜索记录
第一轮:衣/裳/裘/弁/冕/服
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
| 衣 | 1行 | 0行 | L836"抠衣彭公之门"=登门求教之礼节动作,非服饰描述 |
| 裳 | 0行 | 0行 | — |
| 裘 | 0行 | 0行 | — |
| 弁 | 0行 | 0行 | — |
| 冕 | 0行 | 0行 | — |
| 服 | 16次/4行 | 1次 | L127"服虔"=人名;L139"克服""侯服""宾服""夷服"=征服/地域区划;L141"五服五流"=刑罚制度;L143"服从""荒服""近服"=服从/地域区划;L143"服食器用"=衣服·饮食·器皿·用具(唯一服饰义) |
第二轮:冠/带/佩/舄/芾/韨
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
| 冠 | 0行 | 0行 | — |
| 带 | 1行 | 0行 | L118"横带天地西南之半"=横贯比喻,非服饰 |
| 佩 | 0行 | 0行 | — |
| 舄 | 0行 | 0行 | — |
| 芾 | 0行 | 0行 | — |
| 韨 | 0行 | 0行 | — |
第三轮:黼/黻/绣/衮/皮弁/章服
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
| 黼 | 0行 | 0行 | — |
| 黻 | 0行 | 0行 | — |
| 绣 | 0行 | 0行 | — |
| 衮 | 0行 | 0行 | — |
| 皮弁 | 0行 | 0行 | — |
| 章服 | 0行 | 0行 | — |
第四轮:玄衣/黄裳/赤舄/采服/锡服/絺冕
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
| 玄衣 | 0行 | 0行 | — |
| 黄裳 | 0行 | 0行 | — |
| 赤舄 | 0行 | 0行 | — |
| 采服 | 0行 | 0行 | — |
| 锡服 | 0行 | 0行 | — |
| 絺冕 | 0行 | 0行 | — |
第五轮:五服/五采/山龙/华虫/宗彝/藻火/粉米
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
| 五服 | 1行 | 0行 | L141"五服五流"=五种刑罚与五种流放,非服饰五服 |
| 五采 | 0行 | 0行 | — |
| 山龙 | 0行 | 0行 | — |
| 华虫 | 0行 | 0行 | — |
| 宗彝 | 0行 | 0行 | — |
| 藻火 | 0行 | 0行 | — |
| 粉米 | 0行 | 0行 | — |
补充轮:丝/帛/织/缟/纩/锦/絺/檿丝/罽/卉服
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
| 丝 | 0行 | 0行 | — |
| 帛 | 0行 | 0行 | — |
| 织 | 1行 | 1行 | L131"织贝"=扬州入篚织物贡品 |
| 缟 | 1行 | 1行 | L131"珠鱼缟"/"珠玄缟"=徐州入篚丝织贡品 |
| 纩 | 0行 | 0行 | — |
| 锦 | 0行 | 0行 | — |
| 絺 | 0行 | 0行 | — |
| 檿丝 | 0行 | 0行 | — |
| 罽 | 1行 | 0行 | L114"罽宾"=西域国名(Kashmir/Jibin),非毡罽服饰 |
| 卉服 | 0行 | 0行 | — |
噪声排除统计
| 类别 | 排除数 | 典型用例 |
| 服=地域区划 | 8处 | 侯服、宾服、夷服、荒服、近服 |
| 服=刑罚制度 | 2处 | 五服五流 |
| 服=征服/服从 | 3处 | 克服、服从(×2) |
| 服=人名 | 1处 | 服虔(汉代学者) |
| 衣=礼节动作 | 1处 | 抠衣(提衣登门之礼) |
| 带=比喻 | 1处 | 横带天地(横贯比喻) |
| 罽=国名 | 1处 | 罽宾(西域国名) |
| 合计排除 | 17处 | — |
有效服饰条目汇总
| 序号 | 关键词 | 位置 | 类别 | 服饰义 |
| 1 | 织贝 | L131 | 织物贡品 | 扬州入篚织物,织成贝纹之丝织品 |
| 2 | 缟 | L131 | 织物贡品 | 徐州入篚丝织品,白色精细丝帛 |
| 3 | 玄缟 | L131 | 织物贡品 | 玄(赤黑色)与缟(白色)丝织品并称 |
| 4 | 服食器用 | L143 | 服制概念 | 引《旅獒》,衣服为四方贡物四类之一 |
有效条目:4处 | 排除噪声:17处 | 服字噪声率:94%(15/16次为非服饰义)
提取方法
全程使用Python脚本进行关键词搜索与上下文提取,对每个命中行提取前后80字符上下文,逐条甄别服饰义与非服饰义。因本书848行规模适中,bash grep亦可正常工作,但为保持与系列处理一致性,统一使用Python方案。