《日涉编》服饰提取日志

Task ID: 2-149 | 执行时间: 2025年


基本信息

项目 内容
书名 日涉编
作者 陈阶(明代)
输入路径 /home/z/my-project/upload/part2/日涉编.txt
输出路径 /home/z/my-project/upload/2笔记output/日涉编/
文件大小 1,501,028字节
总行数 11,468行
时代 明代(类书)

搜索过程

第1轮:核心服饰词全搜

搜索命令: bash rg -c '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' INPUT_FILE

命中行数: 1,438行(大量命中,需分批审读)

分步策略: 对大文件先搜索高精度制度词(朝服、衮冕、品服、鱼袋等),再补充一般服饰词。

第2轮:制度动作词搜索

搜索命令: bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' INPUT_FILE

命中行数: 约15行(品色、赐紫、赐绯、释褐等多条)

第3轮:组合扩展词搜索

搜索命令: bash rg -n '三品已上服紫|五品已上服绯|六品七品以绿|文官一品仙鹤|武官一品狮子|赐鱼袋|佩鱼|金银鱼袋|大裘而冕|衮冕|鷩冕|毳冕|絺冕|玄冕|软脚|硬脚|展角|交角|乌纱|蟒衣|飞鱼服|斗牛服|麒麟服|蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛' INPUT_FILE

命中行数: 约30行


误命中排除记录(大类统计)

关键词 排除数 主要排除理由
~20条 "履行""履历"等动词义
~30条 "地带""带领"等非腰带义
~15条 "冠军""冠绝"等非首服义
~10条 "钦佩"等心理义
~20条 "服从""服药""服丧"等非服饰义
~15条 "领兵""领命"等动词义
~10条 "水纹"等非纹样义
~15条 "罗列""星罗"等非丝织品义
~5条 "锦州"等地名
~10条 "环能""环境"等非首饰义
~8条 "不胜"等副词义
~10条 "丝竹"(音乐)等非丝织品义

有效条目统计

类别 有效条目 排除条目
首服 6 15
体服 12 25
足服 3 20
腰带 7 30
佩饰 6 10
礼服制度 8 20
衣料 5 15
异族服饰 2 5
合计 50+ 140+

文件产出

文件名 大小 内容
日涉编_总结.md <20KB 服饰内容总结分析
日涉编_日志.md <20KB 搜索过程记录
日涉编_原文提取.md <20KB 服饰原文分类提取

质量自检