《广艺舟双楫》服饰整理日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 广艺舟双楫 |
| 作者 | 康有为(清) |
| 输入文件 | /home/z/my-project/upload/书法/书法/广艺舟双楫.txt |
| 输出目录 | /home/z/my-project/upload/书法output/广艺舟双楫/ |
| 文件总行数 | 1415行 |
| 执行时间 | 2026-03-05 |
执行流程
步骤1:环境准备
- 确认输入文件存在(广艺舟双楫.txt,1415行)
- 创建输出目录 /home/z/my-project/upload/书法output/广艺舟双楫/
步骤2:逐级grep提取
按内置词库分五轮grep,严格使用ripgrep,不整本载入LLM。
第一轮:一级词grep
rg -n '衣|裳|服|冠|冕|弁|帻|巾|帽|袍|裘|带|佩|绶|笏|舄|履|鞋|袜|裙|襦|褐|襕|衫|袴|裈|褙|帔|氅|蓑|铠|甲'
命中行数:约40行(含大量非服饰语义行)
第二轮:二级词grep
rg -n '锦|绮|绢|帛|罗|缎|绸|缯|缣|纱|绫|绡|丝|绵|麻|葛|苎|布衣|金银|玉|珠|翠|翡翠|琥珀|珊瑚'
命中行数:约50行(绝大多数为非服饰语义,如"玉"多指器物、"丝"多指笔丝、"帛"未见)
第三轮:三级词grep
rg -n '衮|黼|黻|章纹|绣|织|染|裁|缝|衽|领|袖|袂|襟|裾|裆|幅|缘饰|旒|旆|旂|旗|卤簿|仪仗'
命中行数:约15行
第四轮:四级词grep
rg -n '品色|服色|冠服|舆服|章服|朝服|公服|祭服|丧服|吉服|常服|便服|燕服|赐服|赐紫|赐绯|品官|命妇|婚服'
命中行数:0行
第五轮:动词词grep
rg -n '赐服|衣冠|佩戴|着披|披裹|束系|脱解|换易|加袭'
命中行数:2行(衣冠2见)
步骤3:人工判定筛选
将五轮grep命中行逐一读取上下文,判定是否含实际服饰语义。
| 判定结果 | 数量 | 占比 |
|---|---|---|
| 有效服饰语义 | 17条 | 约17% |
| 比喻义(冠=居首等) | 约15条 | 约15% |
| 假借义(服=任职等) | 约8条 | 约8% |
| 非服饰(植物/器物/笔法等) | 约50条 | 约50% |
| 重复命中(同一行多词匹配) | 约10条 | 约10% |
步骤4:撰写输出文件
| 文件 | 内容 | 大小 |
|---|---|---|
| 广艺舟双楫_原文提取.md | 17条有效原文,按词目分类,附原文行号、词目、语境 | 待校验 |
| 广艺舟双楫_总结.md | 四部分:文献概况、服饰内容总览、核心发现、结论 | 待校验 |
| 广艺舟双楫_日志.md | 本文件 | 待校验 |
关键决策记录
决策1:蛙掞之"衣"判定为非服饰
第5行"蛙掞之衣,蒙茸茂焉","衣"指苔衣(地衣类植物),非衣物。筛除。
决策2:"冠冕""冠时"判定为比喻义
第945行"斯为冠冕"、第1261行"独出冠时"、第1281行"冠冕海内"、第1337行"独出冠时",冠/冕均为"超越、居首"之义,非指实际冠冕。筛除。
决策3:"服官""服炼"判定为假借义
第722行"服官京朝"之服=任职,第1193行"道士服炼既成"之服=修炼。筛除。
决策4:"商彝汉玉"之玉判定为器物非佩饰
第1237行"如对商彝汉玉",玉为青铜彝器配对之古玉器物,非衣冠佩饰。筛除。
决策5:霓裳判定为服饰词
第1125行"霓裳入听",霓裳指霓裳羽衣曲之舞衣,虽为典故,但裳为一级词且意象指向服饰。保留。
决策6:手版判定为笏之别称
第1125行"手版听鼓",手版即笏板,为一级词笏之同物异名。保留。
决策7:百衲衣判定为服饰词
第1395行"百衲衣",虽为比喻(杂糅各体如僧人百衲衣),但衲衣为实际僧服。保留。
词汇覆盖度分析
| 词库级别 | 总词数 | 命中词数 | 未命中词数 |
|---|---|---|---|
| 一级 | 32 | 12 | 20 |
| 二级 | 26 | 2 | 24 |
| 三级 | 23 | 5 | 18 |
| 四级 | 19 | 0 | 19 |
| 动词 | 12 | 1 | 11 |
未命中原因:《广艺舟双楫》为书论专著,非舆服志或笔记小说,故弁帻巾帽绶笏舄鞋袜襦襕衫裈褙帔氅蓑铠等具体服饰名,以及品色服色朝服公服祭服等制度词均不出现。
执行合规检查
| 铁律 | 执行情况 |
|---|---|
| 1.严禁整本载入LLM | ✅ 仅用grep+sed提取命中行,逐行读取上下文,最大单次读取≤3行 |
| 2.按内置词库grep+sed提取 | ✅ 五轮grep,严格按一至四级+动词词库执行 |
| 3.严禁批处理 | ✅ 逐条读取、逐条判定,无批量灌入 |
| 4.三篇MD≤20KB | 待校验 |
| 5.据实撰写不灌水 | ✅ 有效条目仅17条,筛除过程透明记录 |