《尚书纂传》服饰内容提取·日志

文件:尚书纂传.txt(宋·王天与撰)

路径:/home/z/my-project/upload/尚书/尚书/尚书纂传.txt

大小:2088行,880,586字节

输出目录:/home/z/my-project/upload/尚书output/尚书纂传/


Step 1:文件信息确认


Step 2:第一轮grep(衣/裳/裘/弁/冕/服)

2.1 grep -n "衣"

2.2 grep -n "裳"

2.3 grep -n "裘"

2.4 grep -n "弁"

2.5 grep -n "冕"

2.6 grep -n "服"


Step 3:第二轮grep(冠/带/佩/舄/芾/韨)

3.1 grep -n "冠"

3.2 grep -n "带"

3.3 grep -n "佩"

3.4 grep -n "舄/芾/韨"


Step 4:第三轮grep(黼/黻/绣/衮/皮弁/章服)

4.1 grep -n "黼"

4.2 grep -n "黻"

4.3 grep -n "绣"

4.4 grep -n "衮"

4.5 grep -n "皮弁"

4.6 grep -n "章服"


Step 5:第四轮grep(玄衣/黄裳/赤舄/采服/锡服/絺冕)

5.1 全部零命中(独立组合匹配)


Step 6:第五轮grep(五服/五采/山龙/华虫/宗彝/藻火/粉米)

6.1 grep -n "五服"

6.2 grep -n "五采/山龙/华虫/藻火/粉米"

6.3 grep -n "宗彝"


Step 7:上下文提取

对上述所有服饰义命中行,使用Python提取上下文(前后1-3行),逐条甄别服饰义与非服饰义。

关键上下文提取:


Step 8:噪声过滤

排除行号关键词排除原因
188, 201水政/洪水,非服饰
358织物贡品(织文锦绮),间接相关
467青衣县=地名
842衣/服"服天命"=比喻义
1145革车辎车载"衣装"=军用物资
1176, 1177, 1180非服饰上下文
1328非服饰上下文
1581逸豫无度
1702, 1703, 1706, 1712非直接服饰义
1926越裳氏=国名
275司裘=射礼官职名
1706非服饰上下文
598弁髦=比喻义
1063非服饰上下文
432, 728, 1177, 1862非服饰义上下文
40, 41, 57, 163, 174冠篇首/冠诸臣之上/既冠=非服饰
381, 537, 1007, 1209, 1216, 1497非服饰义
432, 482, 524阻山带河=地理比喻
964佩服=比喻义
1358, 1746采服采服=周制地域区划
1797, 1804, 1805黼扆=屏风(器物义)
1830, 1842总说段落
1247, 1873非服饰上下文
510山龙地名异文
约155行服从/服事/服刑/地域/官职等

Step 9:最终确认


Step 10:审查结果