融堂书解·服饰内容提取日志
基本信息
- 文件路径:
/home/z/my-project/upload/尚书/尚书/融堂书解.txt - 文件规模:1,054行
- 输出目录:
/home/z/my-project/upload/尚书output/融堂书解/
五轮关键词搜索
第一轮:衣/裳/裘/弁/冕/服
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
|---|---|---|---|
| 衣 | 9行 | 5行 | L129衣冠(文明象征)、L485衣裳在笥、L574垂衣(比喻义排除)、L599画之衣冠、L961舞衣 |
| 裳 | 3行 | 3行 | L485衣裳在笥、L963黼裳/蚁裳/彤裳、L964黼裳(同L963) |
| 裘 | 1行 | 1行 | L964裘冕(六冕之首) |
| 弁 | 2行 | 2行 | L644尽弁、L961雀弁/綦弁 |
| 冕 | 5行 | 5行 | L394冕服、L955冕服、L961冕执刘等、L963麻冕、L964六冕详述 |
| 服 | 约190行 | 约15行 | 噪声率约92%:服从/服行/地域义/职事义等 |
第二轮:冠/带/佩/舄/芾/韨
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
|---|---|---|---|
| 冠 | 3行 | 2行 | L129衣冠(文明象征)、L599画之衣冠 |
| 带 | 0行 | 0行 | — |
| 佩 | 0行 | 0行 | — |
| 舄 | 0行 | 0行 | — |
| 芾 | 0行 | 0行 | — |
| 韨 | 0行 | 0行 | — |
第三轮:黼/黻/绣/衮/皮弁/章服
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
|---|---|---|---|
| 黼 | 6行 | 5行 | L961黼纯(席饰)、L963黼裳、L964黼裳 |
| 黻 | 1行 | 1行 | L217黼黻絺绣 |
| 绣 | 2行 | 2行 | L217絺绣、L972琥以绣璜以黼 |
| 衮 | 1行 | 1行 | L964衮冕/衮衣 |
| 皮弁 | 0行 | 0行 | — |
| 章服 | 0行 | 0行 | — |
第四轮:玄衣/黄裳/赤舄/采服/锡服/絺冕
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
|---|---|---|---|
| 玄衣 | 1行 | 1行 | L964祭服皆玄衣纁裳 |
| 黄裳 | 0行 | 0行 | — |
| 赤舄 | 0行 | 0行 | — |
| 采服 | 0行 | 0行 | — |
| 锡服 | 0行 | 0行 | — |
| 絺冕 | 1行 | 1行 | L964絺冕五旒 |
第五轮:五服/五采/山龙/华虫/宗彝/藻火/粉米
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
|---|---|---|---|
| 五服 | 约15行 | 2行 | L210五服五章(服饰义)、其余均为地域义 |
| 五采 | 2行 | 2行 | L217五采彰施于五色、L964五采丝绳 |
| 山龙 | 1行 | 1行 | L217山龙华虫 |
| 华虫 | 1行 | 1行 | L217山龙华虫 |
| 宗彝 | 2行 | 2行 | L217宗彛(异体)、L618宗彝(宗庙器物,间接) |
| 藻火 | 1行 | 1行 | L217藻火粉米 |
| 粉米 | 1行 | 1行 | L217藻火粉米 |
补充搜索
| 关键词 | 命中行数 | 服饰义行数 | 说明 |
|---|---|---|---|
| 车服以庸 | 2行 | 2行 | L110、L221 |
| 织皮 | 3行 | 2行 | L254(梁州贡)、L257(西戎以织皮为衣) |
| 皮服 | 1行 | 1行 | L242岛夷皮服 |
| 卉服 | 1行 | 1行 | L249岛夷卉服 |
| 三帛 | 1行 | 1行 | L108三帛(贽物织物) |
| 丝/枲/纩 | 约8行 | 约6行 | L243漆丝/织文、L245丝枲/檿丝、L247玄纤缟、L253絺纻/纤纩 |
| 卑服 | 1行 | 1行 | L817文王卑服 |
| 丧服 | 1行 | 1行 | L975反丧服 |
| 释冕 | 1行 | 1行 | L975王释冕 |
噪声排除汇总
- "服"字噪声:约175处(服从义约80处、地域义约50处、职事义约30处、刑罚义约10处、其他约5处)
- "五服"噪声:约13处地域义
- "垂衣拱手":1处比喻义
- "一戎衣":1处军事行动义
- "缀衣":2处幄帐义
- "衣德言":1处服行义
- L961"黼纯""画纯""玄纷纯"为席饰非服饰,但为服饰制度相关陈设
处理方式
- 全程使用grep -n定位 + Python上下文提取
- 逐条甄别服饰义与非服饰义
- 关键行提取上下文用于原文提取MD