尚书说 服饰内容提取日志
文件信息
- 文件:/home/z/my-project/upload/尚书/尚书/尚书说.txt
- 规模:267行,421,877字节(超长行格式,最长18,742字符/行)
- 输出目录:/home/z/my-project/upload/尚书output/尚书说/
搜索轮次记录
第一轮:衣/裳/裘/弁/冕/服
| 关键词 | 命中行数 | 服饰义行数 | 备注 |
|---|---|---|---|
| 衣 | 12 | 6 | 非服饰:衣德言(L171)、一戎衣(L135)、缀衣(L232×3)、越裳氏(L28) |
| 裳 | 5 | 4 | 越裳氏(L28)为地名;L35/L104/L145/L232为服饰义 |
| 裘 | 1 | 0 | L46"织皮裘罽"为织物贡品非裘服 |
| 弁 | 3 | 3 | 尽弁(L143/145)、雀弁綦弁皮弁(L232) |
| 冕 | 7 | 5 | 冕服(L83/232)、麻冕(L232)、衮冕(L168)、鷩冕(L171)、释冕(L235) |
| 服 | 45 | 7 | 噪声率约84%:服从/服行/服膺/六服/兵服/服贾等 |
第二轮:冠/带/佩/舄/芾/韨
| 关键词 | 命中行数 | 服饰义行数 | 备注 |
|---|---|---|---|
| 冠 | 8 | 1 | L145"成王冠成人"=冠礼(间接服饰义);余为"冠篇首"(L45)/"被发缨冠"(L166比喻)/议论之冠(L256) |
| 带 | 1 | 0 | L46"襟带"=比喻义 |
| 佩 | 0 | 0 | — |
| 舄 | 0 | 0 | — |
| 芾 | 0 | 0 | — |
| 韨 | 0 | 0 | — |
第三轮:黼/黻/绣/衮/皮弁/章服
| 关键词 | 命中行数 | 服饰义行数 | 备注 |
|---|---|---|---|
| 黼 | 3 | 3 | 十二章(L35)、黼裳(L232)、黼冔(L168);L232"黼扆/黼纯"为器物席饰 |
| 黻 | 3 | 2 | 十二章(L35)、玄衮及黻(L171);L232"黼黻文之盛"为评价语 |
| 绣 | 3 | 3 | 絺绣(L35)、绣裳(L145/232);L232"白与黑绣之曰黼"为席饰义 |
| 衮 | 4 | 3 | 衮衣(L145)、衮冕(L168)、玄衮及黻(L171);L232"衮冕裳四章" |
| 皮弁 | 1 | 1 | L232"綦弁皮弁也" |
| 章服 | 1 | 1 | L35"十二章服"论述 |
第四轮:玄衣/黄裳/赤舄/采服/锡服/絺冕
| 关键词 | 命中行数 | 服饰义行数 | 备注 |
|---|---|---|---|
| 全部 | 0 | 0 | 无独立匹配。但L171内嵌"玄衮"、L232内嵌"玄衮及黼"属复合词 |
第五轮:五服/五采/山龙/华虫/宗彝/藻火/粉米
| 关键词 | 命中行数 | 服饰义行数 | 备注 |
|---|---|---|---|
| 五服 | 8 | 2 | L33/L35为服饰义=五服五章;余为地域义(L28/46/71/196/214) |
| 五采 | 2 | 2 | L35/L232均为服饰义 |
| 山龙 | 1 | 1 | L35十二章 |
| 华虫 | 1 | 1 | L35十二章 |
| 宗彝 | 1 | 1 | L35十二章 |
| 宗彞 | 3 | 1 | L35为服饰义;L139"班宗彞"=祭器(非服饰);L178"班宗彞"同 |
| 藻火 | 1 | 1 | L35十二章 |
| 粉米 | 1 | 1 | L35十二章 |
甄别统计
- 总关键词命中:约107处
- 非服饰用法排除:约89处
- 服字噪声率:约84%(45命中中仅7处为服饰义)
- 冠字噪声率:约88%(8命中中仅1处为间接服饰义)
- 五服噪声率:约75%(8命中中仅2处为服饰义)
- 最终有效服饰条目:约18处
提取方法
- 因文件超长行特征(267行/421KB),全程使用Python脚本进行关键词搜索与上下文提取
- 对18个关键行进行Python上下文提取(前后60-120字符),逐条甄别服饰义与非服饰义
- 排除"缀衣=幄帐""一戎衣=军事行动""衣德言=比喻""越裳氏=地名""冠篇首=非服饰""襟带=比喻""织皮裘罽=织物贡品"等