书经大全·服饰内容提取日志
基本信息
- 文件路径:/home/z/my-project/upload/尚书/尚书/书经大全.txt
- 文件大小:1,158,603字节
- 总行数:2,829行
- 最长行:3,566字符
- 输出目录:/home/z/my-project/upload/尚书output/书经大全/
五轮Grep结果
Round 1:衣/裳/裘/弁/冕/服
| 关键词 | 命中行数 | 服饰义行数 |
| 衣 | 56 | 10 |
| 裳 | 8 | 5 |
| 裘 | 7 | 3 |
| 弁 | 13 | 7 |
| 冕 | 16 | 12 |
| 服 | 211 | 22 |
Round 2:冠/带/佩/舄/芾/韨
| 关键词 | 命中行数 | 服饰义行数 |
| 冠 | 16 | 4 |
| 带 | 6 | 1 |
| 佩 | 10 | 0 |
| 舄 | 0 | 0 |
| 芾 | 0 | 0 |
| 韨 | 0 | 0 |
Round 3:黼/黻/绣/衮/皮弁/章服
| 关键词 | 命中行数 | 服饰义行数 |
| 黼 | 15 | 10 |
| 黻 | 3 | 3 |
| 绣 | 5 | 3 |
| 衮 | 11 | 6 |
| 皮弁 | 2 | 2 |
| 章服 | 0 | 0 |
Round 4:玄衣/黄裳/赤舄/采服/锡服/絺冕
| 关键词 | 命中行数 | 服饰义行数 |
| 玄衣 | 0 | 0 |
| 黄裳 | 0 | 0 |
| 赤舄 | 0 | 0 |
| 采服 | 2 | 0(均地域义) |
| 锡服 | 0 | 0 |
| 絺冕 | 2 | 2 |
Round 5:五服/五采/山龙/华虫/宗彝/藻火/粉米
| 关键词 | 命中行数 | 服饰义行数 |
| 五服 | 20 | 2 |
| 五采 | 6 | 4 |
| 山龙 | 1 | 1 |
| 华虫 | 3 | 3 |
| 宗彝 | 4 | 2 |
| 藻火 | 1 | 1 |
| 粉米 | 2 | 2 |
噪声排除详情
"服"字噪声(约189行非服饰义)
- 五服=地域区划义:约16行(L866, L928, L1263, L1974, L2019, L2484, L2509, L2511, L2536等)
- 服=刑罚/服从义:约5行(L928, L929)
- 服=服事/从事义:约30行
- 服=服丧义:约5行
- 服=服用/行用义:约10行
- 其他:约123行
"衣"字噪声(约46行非服饰义)
- 一戎衣=军事行动义:L1807, L1812
- 缀衣=幄帐义:L2602, L2610, L2611
- 垂衣拱手=比喻义:L2677
- 衣=动词穿:L969
"冠"字噪声(约12行非服饰义)
- 冠其篇首=前置义:L60
- 冠石山=地名:L1112
"佩"字噪声(10行全部非服饰义)
- 背音佩=音释标注:无
- 佩=违背义:多数
- 佩=佩服义:少数
"五服"噪声(约18行非服饰义)
- 五服=地域义占90%
- 仅L1010(五服五章)和L1032(弼成五服)部分涉及服饰义
上下文提取
- 共对22个关键行进行Python上下文提取
- 提取范围:前后0-2行,截取400-500字符
- 全程使用Python脚本,未使用bash sed(避免UTF-8编码问题)
输出文件
- 书经大全_总结.md(3,721字节)
- 书经大全_日志.md(本文件)
- 书经大全_原文提取.md