禹贡论 服饰内容提取日志

基本信息

关键词搜索记录

第一轮:衣/裳/裘/弁/冕/服

关键词命中行数服饰义行数说明
1行0行L836"抠衣彭公之门"=登门求教之礼节动作,非服饰描述
0行0行
0行0行
0行0行
0行0行
16次/4行1次L127"服虔"=人名;L139"克服""侯服""宾服""夷服"=征服/地域区划;L141"五服五流"=刑罚制度;L143"服从""荒服""近服"=服从/地域区划;L143"服食器用"=衣服·饮食·器皿·用具(唯一服饰义)

第二轮:冠/带/佩/舄/芾/韨

关键词命中行数服饰义行数说明
0行0行
1行0行L118"横带天地西南之半"=横贯比喻,非服饰
0行0行
0行0行
0行0行
0行0行

第三轮:黼/黻/绣/衮/皮弁/章服

关键词命中行数服饰义行数说明
0行0行
0行0行
0行0行
0行0行
皮弁0行0行
章服0行0行

第四轮:玄衣/黄裳/赤舄/采服/锡服/絺冕

关键词命中行数服饰义行数说明
玄衣0行0行
黄裳0行0行
赤舄0行0行
采服0行0行
锡服0行0行
絺冕0行0行

第五轮:五服/五采/山龙/华虫/宗彝/藻火/粉米

关键词命中行数服饰义行数说明
五服1行0行L141"五服五流"=五种刑罚与五种流放,非服饰五服
五采0行0行
山龙0行0行
华虫0行0行
宗彝0行0行
藻火0行0行
粉米0行0行

补充轮:丝/帛/织/缟/纩/锦/絺/檿丝/罽/卉服

关键词命中行数服饰义行数说明
0行0行
0行0行
1行1行L131"织贝"=扬州入篚织物贡品
1行1行L131"珠鱼缟"/"珠玄缟"=徐州入篚丝织贡品
0行0行
0行0行
0行0行
檿丝0行0行
1行0行L114"罽宾"=西域国名(Kashmir/Jibin),非毡罽服饰
卉服0行0行

噪声排除统计

类别排除数典型用例
服=地域区划8处侯服、宾服、夷服、荒服、近服
服=刑罚制度2处五服五流
服=征服/服从3处克服、服从(×2)
服=人名1处服虔(汉代学者)
衣=礼节动作1处抠衣(提衣登门之礼)
带=比喻1处横带天地(横贯比喻)
罽=国名1处罽宾(西域国名)
合计排除17处

有效服饰条目汇总

序号关键词位置类别服饰义
1织贝L131织物贡品扬州入篚织物,织成贝纹之丝织品
2L131织物贡品徐州入篚丝织品,白色精细丝帛
3玄缟L131织物贡品玄(赤黑色)与缟(白色)丝织品并称
4服食器用L143服制概念引《旅獒》,衣服为四方贡物四类之一

有效条目:4处 | 排除噪声:17处 | 服字噪声率:94%(15/16次为非服饰义)

提取方法

全程使用Python脚本进行关键词搜索与上下文提取,对每个命中行提取前后80字符上下文,逐条甄别服饰义与非服饰义。因本书848行规模适中,bash grep亦可正常工作,但为保持与系列处理一致性,统一使用Python方案。