增注唐策 服饰提取日志
基本信息
- 书名:增注唐策
- 文件路径:/home/z/my-project/upload/诗集/诗集/增注唐策.txt
- 输出路径:/home/z/my-project/upload/诗集output/增注唐策/
- 处理时间:2026-03-04
步骤一:文件统计
- 命令:
wc -l -c 增注唐策.txt - 结果:273行,268,170字节
- 说明:大文件,单行极长(策论文本连续排列)
步骤二:五轮Grep检索
第1轮:核心词检索
- 关键词:衣裳|裘|冠|冕|弁|帻|巾|帽|佩玉|带|绶|笏|舄|履|靴|袍|衫|裙|褶|袂|襟|领
- 命中行:34, 35, 38, 40, 41, 49, 51, 78, 105, 131, 133, 141, 158
- 主要发现:冠屦、冕旒、衣弋绨、革舄、垂衣裳、武弁、衣冠
第2轮:材质检索
- 关键词:锦|绮|绢|帛|丝|缎|绫|罗|纱|缟|绸|葛|麻|褐|布|绵|茧
- 命中行:34, 38, 41, 51, 133, 141, 158, 187
- 主要发现:缣缯、纨罽、锦绣纂组、绢帛缯纩、弋绨
- 注意:文件存在编码问题,部分检索超时
第3轮:色彩纹饰检索
- 关键词:紫|绯|朱|赭|青|绿|白|玄|黄|丹|素|绣|纹|章|黼|黻|华
- 命中行较多(色彩词泛化严重)
- 有效发现:丹雘之饰、绣衣持斧、锦绣、黻冕、紫极
- 注意:"华""白""素"等词大量出现但多非服饰语境,已筛除
第4轮:制度检索
- 关键词:服赐|赐服|赐紫|赐绯|品色|舆服|章服|冠服|朝服|祭服|丧服|常服|加冠|衮
- 命中行:34, 41, 51, 78
- 主要发现:车服以庸、舆服礼物、章服、冠服制度
- 注意:"服"字大量作"服用""服从"解,已严格筛除
第5轮:配饰检索
- 关键词:簪|钗|钿|珰|珥|环|镯|鱼袋|幞头|云肩|霞帔|蔽膝|芾|韠|佩鱼
- 命中行:51, 105, 131
- 主要发现:玉具剑环佩、簪裾雅望
步骤三:Sed提取
- 使用rg -n定位行号后,逐行提取相关段落
- 因单行极长,采用关键词上下文截取方式
步骤四:筛选
- "服"作"服用/服从"解的用例(如"五刑有服""服前王之未服")
- "衣"作"穿着"动词解的用例(如"衣不曳地"保留,"人冻而后衣之"筛除——此为动词"穿衣")
- "华"作"浮华/华夏"解的用例
- "素"作"质朴"解的用例
- 色彩词非服饰语境者
- 服饰名词(冠、冕、袍、舄等)
- 服饰制度(车服、章服等)
- 纺织品名(绢、帛、缯、纩等)
- 服饰相关典故(衣弋绨、焚雉头裘等)
步骤五:分类整理
- 共分为5大类:冠服制度、服饰俭奢、赏赐服饰、纺织赋税、配饰
- 有效服饰段落约20处
步骤六:输出
- 增注唐策_总结.md ✓
- 增注唐策_日志.md ✓
- 增注唐策_原文提取.md ✓
遇到的问题
- 文件编码问题:部分字节超出UTF-8范围,导致rg报错,改用兼容模式
- 单行极长:策论文本连续排列,单行可达数万字节,影响检索效率
- "服"字歧义:出现频率极高但多非服饰义,需逐条判断
- 注文与正文混排:增注以【崇曰】【李曰】等嵌入正文,提取时需区分