《四书纂疏》服饰信息提取日志
基本信息
- 输入文件:/home/z/my-project/upload/四书/四书纂疏.txt
- 文件大小:1,922,034字节(约1.83MB)
- 总行数:4,560行
- 输出目录:/home/z/my-project/upload/四书output/四书纂疏/
检索过程
第一轮:衣裳裘冠冕弁巾帻帽
- 关键词:衣、裳、裘、冠、冕、弁、巾、帻、帽
- 策略:以复合词优先匹配(衣裳、衣冠、衮冕、鷩冕等),过滤非服饰用法的单字
- 命中:50条
- 主要发现:衮冕/鷩冕等级、衣锦尚褧、前旒黈纩、齐明盛服等
第二轮:服袍衫裙裤褐襦袂裾
- 关键词:服、袍、衫、裙、裤、褐、襦、袂、裾
- 策略:以礼制服饰复合词为主(盛服、祭服、丧服、五服等)
- 命中:78条
- 主要发现:五服制度(斩衰至缌麻)、盛服修身、威仪容止
第三轮:佩饰带绶笏鱼袋玉
- 关键词:佩、饰、带、绶、笏、鱼袋、玉
- 策略:匹配佩玉、笏、鱼袋、绶带等,玉器限礼器(玉爵等)
- 命中:8条
- 主要发现:祭祀用爵(玉爵、瑶爵、散爵),宗器(赤刀、天球等)
第四轮:丝帛绢锦绮绫罗缎绸缂
- 关键词:丝、帛、绢、锦、绮、绫、罗、缎、绸、缂
- 策略:匹配丝帛、布帛、织妇等织物相关词
- 命中:57条
- 主要发现:桑麻可衣、织蒲不仁、缉麻之喻
第五轮:麻葛布绵裘褐毡
- 关键词:麻、葛、布、绵、毡
- 策略:匹配麻布、葛布、缉麻等
- 命中:17条
- 主要发现:缉麻之缉、桑麻、布帛
第六轮:舄履屦靴鞋
- 关键词:舄、履、屦、靴、鞋
- 策略:匹配舄、屦、絇、履等足衣词
- 命中:60条
- 主要发现:屦之有絇以为行戒、举履、足容重
第七轮:染青赤朱黄白黑玄紫
- 关键词:染、青、赤、朱、黄、白、黑、玄、紫
- 策略:匹配颜色+衣的复合词(缁衣、玄衣等)及染色
- 命中:5条
- 主要发现:颜色服饰信息极少,仅零星出现
第八轮:旌旗旂盖帷帐幕
- 关键词:旌、旗、旂、盖、帷、帐、幕
- 策略:匹配旌旗、旗帜、帷帐等
- 命中:6条
- 主要发现:旗帜帷帐信息极少
技术说明
- 初次grep因单字匹配(如"服""玉""白"等)产生大量非服饰用法的噪音
- 采用复合词优先策略,以服饰专有词汇为匹配目标
- 截取关键词前后各60-180字符作为上下文
- 每行仅计一条,避免重复
问题与局限
- 本书为义理疏解,服饰非重点,大量"服""衣""冠"等字用于哲学义理而非服饰实物
- 颜色词(青赤黄白黑等)在本书中主要用于描述气质、天理等抽象概念
- 旌旗帷帐等物在本书中几无涉及
- 丝织品种类信息匮乏,仅"桑麻可衣"等泛指