《读书说》服饰提取工作日志

书名:读书说
作者:(清)胡承诺
输入文件:/home/z/my-project/upload/part4/读书说.txt
输出目录:/home/z/my-project/upload/4笔记output/读书说/
词库版本:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md
处理日期:2026-03-05


一、文件基本信息

项目 数值
文件大小 347,422 字节
总行数 519 行
文件编码 UTF-8(局部有编码问题,第1轮全量grep触发编码错误)
文体 理学笔记,说体,每篇首标篇名,正文为连续论述

二、检索执行记录

第1轮:核心服饰词全搜

命令bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣'

结果:触发编码错误('utf-8' codec can't decode byte 0xef),文件局部编码异常。

调整策略:改用分词搜索,逐一检索各关键词。

分词检索结果

关键词 命中行数 命中行号 审查结论
7行 9, 19, 43, 111, 135, 199, 515 有效:行19(狐白之裘)、行111(衣服采章)、行135(丧服制度)、行199(衣服不贰)、行515(衣冠)
超时未完成 改用组合词搜索
朝服/公服/丧服/吉服等 2行 111, 135 有效
冕/弁/帻/幞头等 2行 111, 135 有效
3行 19, 75, 480 有效
帛/缯帛 2行 123, 135 行123为"币帛"(外交礼品,保留);行135为"缯帛"(吊丧用,保留)
纹/绣/染 未检出服饰语境 无有效命中
丝/绸/绫/罗/绢 未检出服饰语境 "罗"仅见"罗网"义,排除

第2轮:制度动作词搜索

命令bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠'

结果

关键词 命中行数 命中行号 审查结论
2行 119(僭拟成习,非服饰语境), 135(僭礼,间接涉服饰) 行119排除;行135保留
逾制 1行 135 保留——涉及丧服逾制
冠礼 1行 111(冠婚丧祭四礼) 保留
释服 1行 135 保留——丧服释除

第3轮:组合扩展词搜索

命令bash rg -n '冠带|衣冠|布衣|缙绅|介胄|戎服|章服'

结果

关键词 命中行数 命中行号 审查结论
冠带 1行 391 保留——"冠带远夷"
衣冠 2行 82, 135 保留
布衣 2行 111, 135 保留——含社会等级信息
缙绅 1行 391 保留
介胄 1行 391 保留
戎服 1行 391 保留
章服 2行 245, 257 保留

三、排除规则执行记录

按词库第四节"排除规则表"逐条审查:

规则 执行情况
="衣钵"等 未检出
="布衣"代指平民 检出2处,按规则保留
=动词"穿" 行515"敕家人衣白"为动词"穿白",按规则保留
=比喻 行9"衣服饮食之切于身"、行43"衣服有缝纫"为比喻,排除
="麻制" 未检出
="罗列"义 未检出丝织品义"罗"
="环境"义 未检出首饰义"环"
="带领"义 未检出服饰义"领"
="地带/带领"义 行135"墨带公服"为腰带义,保留
="敬佩"义 未检出佩饰义"佩"
="服药/服从/服丧" 大量"服"为非服饰义,已逐一甄别
="冠军"义 未检出首服义"冠"之外用法
="帛书/帛画" 行123"币帛"、行135"缯帛"均为丝帛制度,保留
="锦州"地名 行135"衣锦"为穿锦缎义,保留

四、处理异常记录

异常类型 描述 处理方式
编码错误 第1轮全量rg搜索触发utf-8 codec错误 改用分词搜索绕过
单字搜索超时 "冠""服"单字命中过多导致超时 改用组合词精确搜索
长行截断 本书每行为整篇论述,单行可达数千字 采取整行提取,不做sed片段截取

五、输出文件清单

文件名 说明
读书说_服饰总结.md 服饰内容分类总结与学术评价
读书说_日志.md 本文件,检索与审查过程记录
读书说_服饰原文提取.md 有效服饰原文逐条提取