二家宫词 — 服饰提取日志

处理时间:2026-03-04
源文件:/home/z/my-project/upload/诗集/诗集/二家宫词.txt
输出目录:/home/z/my-project/upload/诗集output/二家宫词/
文件大小:407行 / 35662字节

一、文件概况

$ wc -c -l /home/z/my-project/upload/诗集/诗集/二家宫词.txt
  407  35662

文件407行35KB,属于中等体量,但仍遵循"严禁整本载入LLM"原则,采用grep+sed逐轮提取方式处理。

书籍结构:


二、逐轮检索命令与结果统计

第1轮:核心词检索

$ rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|佩|玉|带|绶|笏|舄|履|靴|袍|衫|裙|褶|袂|襟|领' 二家宫词.txt

命中行数:约120行(含大量"玉"字虚词命中如"玉容""玉露"等),经人工筛选有效服饰行约35行。

筛选标准: "玉"字单独出现时仅保留"玉笋"(簪玉笋,行175)等明确为首饰玉器者,排除"玉容""玉肌""玉肤""玉露""玉墀"等比喻/建筑用法。

第2轮:材质检索

$ rg -n '锦|绮|绢|帛|丝|缎|绫|罗|纱|缟|绸|葛|麻|褐|布|绵|茧' 二家宫词.txt

命中行数:约80行,经筛选有效服饰材质行约25行。

筛选标准: 排除"绮堂"(厅堂)、"绮疏"(窗格)、"绵蛮"(鸟鸣声)、"绵长"(时间长)等非服饰用法。"罗"字保留"轻罗""薄罗""红罗""罗裳""罗衫"等明确为面料/衣物者。

第3轮:色彩纹饰检索

$ rg -n '紫|绯|朱|赭|青|绿|白|玄|黄|丹|素|绣|纹|章|黼|黻|华' 二家宫词.txt

命中行数:约200行(色彩词在诗中极为常见),经筛选与服饰直接相关行约15行。

筛选标准: 仅保留色彩词直接修饰服饰/面料者,如"紫锦班""青袍""绛纱""红罗"等,排除大量风景描写中的色彩词。

第4轮:制度检索

$ rg -n '服|赐服|赐紫|赐绯|品色|舆服|章服|冠服|朝服|祭服|丧服|常服|加冠|衮' 二家宫词.txt

命中行数:2行(行67"陞殿服朝班"、行219"荒服献珍"),有效1行。

筛选标准: "荒服"为古代行政区划概念,与服饰无关,排除。

第5轮:配饰检索

$ rg -n '簪|钗|钿|珰|珥|环|镯|鱼袋|幞头|云肩|霞帔|蔽膝|芾|韠|佩鱼' 二家宫词.txt

命中行数:约20行,经筛选有效配饰行约14行。

筛选标准: 排除"钿筝"(乐器,行113)、"螺钿"(器物工艺,行306),保留花钿、翠钿、珥钿、簪佩等人体佩戴首饰。"环碧"(行289)为环形碧玉景观,非配饰,排除。


三、补充检索

妆束综合检索

$ rg -n '红糚|红妆|淡糚|宫糚|梳糚|新糚|糚束|糚饰' 二家宫词.txt

命中14行,涵盖宫人妆束、淡妆、红妆等综合服饰信息。

冠帽专项检索

$ rg -n '金貂|绣鞶|幞头|唐巾|宫花' 二家宫词.txt

命中8行,补充幞头、唐巾、宫花等冠饰信息。

鞋履专项检索

$ rg -n '弓鞋' 二家宫词.txt

命中1行(行389),为唯一鞋履记载。


四、上下文提取命令

$ sed -n '45p;82p;86p;96p;111p;114p;119p;141,142p;144p;160p;175p;177p;179p;204,205p;210p;221p;228p;233,234p;239p;262p;264p;271p;273p;276p;293p;311p;320p;343p;67p;381p;383p;386p;377p;378p;51p;58p;63p;100p;123p;158,159p;182p;192p;216p;220p;250p;261p;306p;113p;300p;303p;318p;125p;144p' 二家宫词.txt

提取约50行关键原文,用于后续分类整理。


五、对抗式学术审查

审查1:虚词排除

以下高频命中经审查排除:

审查2:典故辨析

审查3:器物与服饰区分

审查4:重复与遗漏


六、输出文件清单

文件名说明
二家宫词_原文提取.md按类别分组的服饰相关原文(附行号)
二家宫词_总结.md服饰内容分类总结与学术分析
二家宫词_日志.md本文件,检索命令与审查过程记录

七、数据统计

类别有效条目数
衣裳袍衫裙31
冠巾幞头2
带绶佩玉9
簪钿珥首饰14
材质纹饰16
服饰制度5
妆束综合14
合计(去重后)约50条

注:部分条目跨多个类别,去重后独立条目约50条。