二妙集 服饰提取日志

任务:二妙集服饰内容逐轮提取
文件:/home/z/my-project/upload/诗集/诗集/二妙集.txt
大小:107,858字节 / 886行
输出目录:/home/z/my-project/upload/诗集output/二妙集/
执行时间:2026年

一、预检阶段

wc -c /home/z/my-project/upload/诗集/诗集/二妙集.txt
# 结果:107858 字节

wc -l /home/z/my-project/upload/诗集/诗集/二妙集.txt
# 结果:886 行

mkdir -p /home/z/my-project/upload/诗集output/二妙集/
# 目录创建成功

文件体积约108KB,886行。按铁律不整本载入LLM,采用grep逐轮提取+sed上下文方案。


二、第1轮检索——核心词

关键词:衣 裳 裘 冕 冕 弁 帻 巾 帽 佩 玉 带 绶 笏 舄 履 靴 袍 衫 裙 褶 袂 襟 领

rg -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|佩|玉|带|绶|笏|舄|履|靴|袍|衫|裙|褶|袂|襟|领" 二妙集.txt

命中行数:约120行(含大量非服饰用法,如"玉堂""玉清""玉钩"等)

初筛有效行:约55行含服饰语义

问题记录


三、第2轮检索——材质

关键词:锦 绮 绢 帛 丝 缎 绫 罗 纱 缟 绸 葛 麻 褐 布 绵 茧

rg -n "锦|绮|绢|帛|丝|缎|绫|罗|纱|缟|绸|葛|麻|褐|布|绵|茧" 二妙集.txt

命中行数:约90行

初筛有效行:约18行含服饰材质语义

问题记录


四、第3轮检索——色彩纹饰

关键词:紫 绯 朱 赭 青 绿 白 玄 黄 丹 素 绣 纹 章 黼 黻 华

rg -n "紫|绯|朱|赭|青|绿|白|玄|黄|丹|素|绣|纹|章|黼|黻" 二妙集.txt | rg -v "青山|青天|白头|白发|白云|白玉|黄金|黄花|黄河|青春|朱颜|紫阳|紫微|..."

命中行数:约80行(经二次过滤排除非服饰色彩词后)

初筛有效行:约10行含服饰色彩语义

关键发现

问题记录


五、第4轮检索——制度

关键词:赐紫 赐绯 品色 舆服 章服 冠服 朝服 祭服 丧服 常服 加冠 衮 服赐

rg -n "赐紫|赐绯|品色|舆服|章服|冠服|朝服|祭服|丧服|常服|加冠|衮|服赐" 二妙集.txt

命中行数:2行

初筛有效行:2行

关键发现

制度词低命中率分析:《二妙集》为遗民诗集,作者不仕元朝,故主动回避品色服制度的正面书写,仅在典故中零星出现。此结果本身即具有学术意义——遗民服饰书写的"制度缺席"正是其政治态度的表达。


六、第5轮检索——配饰

关键词:簪 钗 钿 珰 珥 环 镯 鱼袋 幞头 云肩 霞帔 蔽膝 芾 韠 佩鱼

rg -n "簪|钗|钿|珰|珥|环|镯|鱼袋|幞头|云肩|霞帔|蔽膝|芾|韠|佩鱼" 二妙集.txt

命中行数:约15行

初筛有效行:8行

关键发现

问题记录


七、上下文提取

# 对55个有效行号执行sed提取完整行
for line in 50 94 105 110 114 122 135 155 187 207 214 220 236 239 249 254 257 280 284 289 290 305 307 317 322 333 340 342 344 361 366 380 388 393 395 401 403 407 429 433 451 459 461 463 466 468 474 480 506 530 535 551 599 614 617 621 623 658 668 674 677 682 684 685 735 773 779 784 786 789 807 820 836 879; do sed -n "${line}p" 二妙集.txt; done

八、对抗式学术审查

审查1:误收风险排查

嫌疑条目行号审查结论
绮语94排除。佛教用语"华丽言辞",非绮织物
衮衮782排除。形容词"连续不断",非衮服
玉堂金马583/591排除。官署代称,非玉饰
玉笏322排除。"玉防"为版本异文,原字不可确认为笏
朱轮皂盖114排除。车舆制度,归入车服而非服饰
绣帐403边缘。绣帐可为室内帷帐,与服饰关联弱,保留但标注
金阙620/625排除。宫门代称
素琴599排除。"素"为朴素义,非色彩

审查2:漏收风险评估

潜在漏收评估
"兠鍪"(行105)军用头盔,属甲胄类。虽非典型服饰,但与服饰制度相关,已收录
"绵蕝"(行105)朝仪用物,属制度类,已收录
"繐帷"(行207)丧礼帷帐,与丧服制度相关,属边缘条目,未收录
"翠帷"(行399/672)室内帷帐,非服饰,未收录

审查3:分类合理性

审查4:学术可靠性自检


九、输出文件

文件名内容大小
二妙集_总结.md分类详述+学术价值评估<20KB
二妙集_日志.md本文件,完整操作记录<20KB
二妙集_原文提取.md65条原文带行号<20KB

十、命令执行汇总

# 1. 文件预检
wc -c /home/z/my-project/upload/诗集/诗集/二妙集.txt     # 107858
wc -l /home/z/my-project/upload/诗集/诗集/二妙集.txt     # 886

# 2. 创建输出目录
mkdir -p /home/z/my-project/upload/诗集output/二妙集/

# 3. 第1轮:核心词
rg -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|佩|玉|带|绶|笏|舄|履|靴|袍|衫|裙|褶|袂|襟|领" 二妙集.txt

# 4. 第2轮:材质
rg -n "锦|绮|绢|帛|丝|缎|绫|罗|纱|缟|绸|葛|麻|褐|布|绵|茧" 二妙集.txt

# 5. 第3轮:色彩纹饰(含二次过滤)
rg -n "紫|绯|朱|赭|青|绿|白|玄|黄|丹|素|绣|纹|章|黼|黻" 二妙集.txt | rg -v "青山|青天|白头|..."

# 6. 第4轮:制度
rg -n "赐紫|赐绯|品色|舆服|章服|冠服|朝服|祭服|丧服|常服|加冠|衮|服赐" 二妙集.txt

# 7. 第5轮:配饰
rg -n "簪|钗|钿|珰|珥|环|镯|鱼袋|幞头|云肩|霞帔|蔽膝|芾|韠|佩鱼" 二妙集.txt

# 8. 上下文提取
for line in 50 94 105 ... 879; do sed -n "${line}p" 二妙集.txt; done

# 9. 精确复核
rg -n "衣衾|加冠履|襃衣博带|綦弁|葛屦|緼袍|绣衣锦帽|..." 二妙集.txt

日志结束