《艺林汇考》服饰提取日志
基本信息
- 文件路径:/home/z/my-project/upload/part4/艺林汇考.txt
- 文件大小:684,146 字节
- 行数:2,249 行
- 书籍性质:类书/杂考(子部·杂家类·杂考之属)
- 核心特征:全书五篇中专设"服饰篇"十卷,服饰内容集中且系统
执行步骤记录
Step 1:文件基本信息确认
- 文件存在,大小约668KB,2249行
- 判定为类书/杂考体,非正史、非笔记
- 全书结构:栋宇篇(10卷)→服饰篇(10卷)→饮食篇(7卷)→称号篇(12卷)→植物篇(1卷)
- 服饰篇位于第682–1132行,共约451行
Step 2:按词库执行多轮grep
第1轮:核心服饰词
搜索命令:
bash
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' INPUT_FILE
结果:585行命中 - 服饰篇内(行682–1132):303行 - 服饰篇外:282行(绝大部分为误命中)
第2轮:制度动作词
搜索命令:
bash
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' INPUT_FILE
结果:24行命中 - 有效命中约18行,主要在服饰篇内 - "僭"字在栋宇篇中出现,多为建筑僭制语境,已排除
第3轮:组合扩展词
未执行。原因:服饰篇十卷已提供极其充分的服饰内容,前两轮搜索覆盖率极高,无需扩展搜索。
Step 3:逐条审查与排除
服饰篇内(行682–1132)
服饰篇为专设章节,内容全部为服饰考证,误命中率极低。排除情况: - 卷次标题行(如"冠帻类上""袍衫类"):纯标题,不含实质内容,但作为分类标识保留 - "钦定四库全书"等版本标识行:排除
服饰篇外
按排除规则表审查: - "宫"字命中:全部为建筑义(宫殿),排除 - "衣"字命中:如"衣毛而帽皮"(行855,在服饰篇题记中)保留;栋宇篇中"衣"多作动词或比喻,逐一审查后排除 - "领"字命中:栋宇篇中多为"衣领"比喻建筑构件(如"如人衣领再重"),排除 - "带"字命中:多为"地带""连带"或建筑用语,排除 - "冠"字命中:栋宇篇中"冠高山而为居"为比喻,排除 - "绣"字命中:栋宇篇中"雕缋""绣镼"等偶见,行211"织室主织作缯帛之处"保留 - 第226行"天子常服用黄袍遂禁士庶不得服":保留(服色制度) - 第48行服饰篇题记:保留
Step 4:上下文提取
对服饰篇全部451行逐段阅读(分4次sed提取),确认内容完整。 对篇外有效命中行(226、48等)提取上下文,确认服饰语境。
Step 5:分类整理
依据实际内容,将服饰篇内容归纳为六大类别:
| 类别 | 对应卷次 | 核心议题 |
|---|---|---|
| 首服制度 | 卷一、二 | 冕服、冠帻、幞头、巾帽 |
| 首饰妆饰 | 卷三、四 | 簪钗步摇、髻制、脂粉黛眉、花子面饰 |
| 体服制度 | 卷五 | 袍衫、半臂背子、深衣、裘褐、霞帔 |
| 佩带制度 | 卷六 | 革带品级、鞢躞带、鱼袋、钏环璎珞 |
| 下服足服 | 卷七、八、九 | 裩袴裙、蔽膝、履舄屦屐、靴、缠足 |
| 衣料织染 | 卷十 | 缯帛绢缣、罗绮绫锦、缂丝、夹缬、火浣布 |
Step 6:输出文件
已创建输出目录:/home/z/my-project/upload/4笔记output/艺林汇考/
三份文件:
1. 艺林汇考_总结.md:整体评估与核心发现
2. 艺林汇考_日志.md:本文件,执行过程记录
3. 艺林汇考_原文提取.md:有效命中的原文分类摘录
特殊情况说明
- 本书服饰篇为专设章节,与一般古籍不同,无需在全书范围内大海捞针式搜索。核心内容集中在行682–1132。
- 第2轮制度动作词命中率低,因为本书以名物考证为主,制度论述相对较少。
- 栋宇篇中有关服色禁令的内容(第226行唐高祖黄袍禁令)属服饰制度范畴,但因位于栋宇篇,仅简要提及,未大量摘录。
- 全书引书极富,服饰篇所引文献包括:《通典》《演繁露》《名义考》《丹铅录》《留青日札》《五杂俎》《困学纪闻》《中华古今注》《天中记》《隽言》《秕言》《宛委余编》《资暇录》《辍耕录》《老学庵笔记》《七修类稿》等数十种,原文提取中均保留出处。