《尚书纂传》服饰内容提取·日志
文件:尚书纂传.txt(宋·王天与撰)
路径:/home/z/my-project/upload/尚书/尚书/尚书纂传.txt
大小:2088行,880,586字节
输出目录:/home/z/my-project/upload/尚书output/尚书纂传/
Step 1:文件信息确认
- 行数:2088行
- 字节数:880,586(含878,498 UTF-8字节)
- 最大行长:2463字符
- 平均行长:141字符
- 作者:宋·王天与
- 性质:尚书纂注,汇集汉孔氏、唐孔氏、郑玄、蔡氏、吕氏、苏氏、陈氏、林氏等诸家注释
Step 2:第一轮grep(衣/裳/裘/弁/冕/服)
2.1 grep -n "衣"
- 命中行:188, 201, 273, 358, 395, 467, 508, 728, 842, 962, 963, 1145, 1176, 1177, 1180, 1280, 1328, 1361, 1362, 1581, 1582, 1701, 1702, 1703, 1706, 1712, 1796, 1797, 1804, 1805等
- 共37行
- 服饰义行:273, 395, 508, 728, 962, 963, 1145, 1280, 1361, 1362, 1582, 1701, 1796, 1797, 1804, 1805
- 非服饰义行:188(水政), 201(洪水), 358(织物贡品), 467(青衣县地名), 842(服天命), 1176(戎车), 1177(大统), 1180(非服饰), 1328(非服饰), 1581(逸豫), 1702(非服饰), 1703(非服饰), 1706(缀衣官职/非直接服饰), 1712(非服饰)
2.2 grep -n "裳"
- 命中行:273, 962, 963, 1280, 1843, 1844, 1845, 1846, 1847, 1848, 1926
- 共11行
- 服饰义行:273, 962, 963, 1280, 1843, 1844, 1845, 1846, 1847, 1848
- 非服饰义行:1926(越裳氏=国名)
2.3 grep -n "裘"
- 命中行:275, 474, 795, 1197, 1213, 1706
- 共6行
- 服饰义行:474(织皮裘), 795(大裘之冕), 1197(夏葛冬裘), 1213(裘葛)
- 非服饰义行:275(司裘=射礼官职), 1706(非服饰上下文)
2.4 grep -n "弁"
- 命中行:598, 795, 1063, 1279, 1280, 1831, 1832, 1833, 1834, 1841
- 共10行
- 服饰义行:795, 1279, 1280, 1831, 1832, 1833, 1834, 1841
- 非服饰义行:598(弁髦=比喻), 1063(非服饰上下文)
2.5 grep -n "冕"
- 命中行:273, 432, 728, 795, 1177, 1792, 1793, 1832, 1835, 1836, 1837, 1839, 1840, 1841, 1843, 1844, 1845, 1847, 1862, 1883, 1884
- 共21行
- 服饰义行:273, 795, 1792, 1793, 1832, 1835, 1836, 1837, 1839, 1840, 1841, 1843, 1844, 1845, 1847, 1883, 1884
- 非服饰义行:432(荆州贡品,无冕义), 728(服阕=丧服期满), 1177(大统未集), 1862(篇末总说)
2.6 grep -n "服"
- 命中行:约176行
- 服饰义行约21行:273, 395, 474, 508, 728, 795, 962, 963, 1280, 1582, 1701, 1792, 1793, 1796, 1797, 1831, 1841, 1843, 1844, 1845, 1846, 1847, 1848, 1883, 1884
- 非服饰义行约155行(服从/服事/服刑/地域/官职/服田/服贾/大歴服/初服/新服/厌服等)
- 服字噪声率:约88%
Step 3:第二轮grep(冠/带/佩/舄/芾/韨)
3.1 grep -n "冠"
- 命中行:40, 41, 57, 163, 174, 381, 395, 508, 537, 795, 1007, 1209, 1216, 1497, 1793, 1884
- 共16行
- 间接服饰义行:795(冕冠也), 1793(被以冠冕), 1884(因丧服而冠)
- 非服饰义行:40(既冠=成人礼), 41(冠篇首), 57(冠其篇首), 163(冠诸臣之上), 174(冠诸臣之上), 381(非服饰), 395(冠之=居于首位), 508(织皮冠之=居首), 537(非服饰), 1007(雉有冠=鸟冠), 1209(非服饰), 1216(非服饰), 1497(非服饰)
3.2 grep -n "带"
- 命中行:432, 482, 524
- 共3行,均为非服饰义(阻山带河=地理比喻)
3.3 grep -n "佩"
- 命中行:964
- 共1行,非服饰义("佩服"=比喻义)
3.4 grep -n "舄/芾/韨"
- 命中:0行
Step 4:第三轮grep(黼/黻/绣/衮/皮弁/章服)
4.1 grep -n "黼"
- 命中行:272, 273, 795, 1793, 1797, 1804, 1805, 1806, 1807, 1830, 1842, 1843, 1844, 1873, 1884
- 共15行
- 服饰义行:272, 273, 795(常服黼冔), 1806(黼纯=衣缘), 1807(黼纯), 1843(黼裳), 1844(衮衣之裳非独有黼), 1884(脱去黼冕)
- 非服饰/器物义行:1793(冠冕=非黼义), 1797(黼扆=屏风), 1804(黼扆=屏风), 1805(黼扆=屏风), 1830(总说), 1842(总说), 1873(非黼义)
4.2 grep -n "黻"
- 命中行:272, 273, 1844
- 共3行,均为服饰义
4.3 grep -n "绣"
- 命中行:272, 273, 1247, 1807, 1873
- 共5行
- 服饰义行:272, 273(絺绣), 1807(刺绣/画绣)
- 非服饰义行:1247(非服饰上下文), 1873(非服饰上下文)
4.4 grep -n "衮"
- 命中行:273, 395, 795, 1844
- 共4行,均为服饰义
4.5 grep -n "皮弁"
- 命中行:1280, 1834
- 共2行,均为服饰义
4.6 grep -n "章服"
- 命中:0行
Step 5:第四轮grep(玄衣/黄裳/赤舄/采服/锡服/絺冕)
5.1 全部零命中(独立组合匹配)
- 玄衣:0行(但L273含"玄衣纁裳"分散出现)
- 黄裳:0行
- 赤舄:0行
- 采服:2行(L1358, L1746,均为地域义=采服=采地之服)
- 锡服:0行
- 絺冕:0行
Step 6:第五轮grep(五服/五采/山龙/华虫/宗彝/藻火/粉米)
6.1 grep -n "五服"
- 命中行:63, 145, 146, 251, 252, 280, 281, 283, 545, 553, 554, 556, 557, 728, 1175, 1305, 1358, 1448, 1745, 1746
- 共20行
- 服饰义行:251-252(五服五章)
- 刑罚义行:145-146(五服三就)
- 地域义行:63, 280, 281, 283, 545, 553, 554, 556, 557, 728, 1175, 1305, 1358, 1448, 1745, 1746
6.2 grep -n "五采/山龙/华虫/藻火/粉米"
- 命中行:272, 273(均属十二章服段落),510(山龙=地名异文)
- 服饰义行:272, 273
- 非服饰义行:510
6.3 grep -n "宗彝"
- 命中:0行(L272-273原文作"宗彛"异体,未匹配)
Step 7:上下文提取
对上述所有服饰义命中行,使用Python提取上下文(前后1-3行),逐条甄别服饰义与非服饰义。
关键上下文提取:
- L272-273:十二章服核心段落(全行超2000字符,提取服饰相关子段)
- L251-252:五服五章
- L795:冕服奉嗣王
- L962-964:衣裳在笥
- L1279-1280:皮弁
- L1582:文王卑服
- L1792-1793:被冕服凭玉几
- L1796-1797:缀衣幄帐
- L1804-1807:黼扆缀衣/黼纯
- L1831-1841:雀弁/綦弁/冕
- L1843-1848:麻冕三裳
- L1883-1884:释冕反丧服
Step 8:噪声过滤
| 排除行号 | 关键词 | 排除原因 |
|---|---|---|
| 188, 201 | 衣 | 水政/洪水,非服饰 |
| 358 | 衣 | 织物贡品(织文锦绮),间接相关 |
| 467 | 衣 | 青衣县=地名 |
| 842 | 衣/服 | "服天命"=比喻义 |
| 1145 | 衣 | 革车辎车载"衣装"=军用物资 |
| 1176, 1177, 1180 | 衣 | 非服饰上下文 |
| 1328 | 衣 | 非服饰上下文 |
| 1581 | 衣 | 逸豫无度 |
| 1702, 1703, 1706, 1712 | 衣 | 非直接服饰义 |
| 1926 | 裳 | 越裳氏=国名 |
| 275 | 裘 | 司裘=射礼官职名 |
| 1706 | 裘 | 非服饰上下文 |
| 598 | 弁 | 弁髦=比喻义 |
| 1063 | 弁 | 非服饰上下文 |
| 432, 728, 1177, 1862 | 冕 | 非服饰义上下文 |
| 40, 41, 57, 163, 174 | 冠 | 冠篇首/冠诸臣之上/既冠=非服饰 |
| 381, 537, 1007, 1209, 1216, 1497 | 冠 | 非服饰义 |
| 432, 482, 524 | 带 | 阻山带河=地理比喻 |
| 964 | 佩 | 佩服=比喻义 |
| 1358, 1746 | 采服 | 采服=周制地域区划 |
| 1797, 1804, 1805 | 黼 | 黼扆=屏风(器物义) |
| 1830, 1842 | 黼 | 总说段落 |
| 1247, 1873 | 绣 | 非服饰上下文 |
| 510 | 山龙 | 地名异文 |
| 约155行 | 服 | 服从/服事/服刑/地域/官职等 |
Step 9:最终确认
- 有效服饰相关条目:17处
- 分属8个类别(十二章服、冕服制度、冠弁制度、衣裳赏赐、裳饰纹样、四夷服饰、车服服章、服饰与德行)
- 核心段落:L272-273(十二章服详解,汇集汉孔/郑玄/蔡氏三家注释兼引周礼六冕)、L1843-1848(康王即位麻冕三裳)、L1883-1884(释冕反丧服)
Step 10:审查结果
- 全部5轮grep已完成,无遗漏
- 第四轮全部零命中(独立组合),但L273中分散出现"玄衣纁裳"已补入
- 第五轮中"五服"大量为地域义(约80%),已逐条甄别
- "宗彝"零命中系因原文作"宗彛"异体,L272-273已收录含"宗彛"原文
- 所有服饰义条目均已完成Python上下文提取
- 3份MD文件已写入输出目录