十先生奥论注 服饰内容提取日志

基本信息

项目内容
书名十先生奥论注
文件路径/home/z/my-project/upload/诗集/诗集/十先生奥论注.txt
输出目录/home/z/my-project/upload/诗集output/十先生奥论注/
文件大小981行 / 650,700字节
处理日期2026-03-04

处理步骤记录

Step 1: 文件大小检查

wc -l -c 十先生奥论注.txt
# 结果:981行,650700字节

文件约650KB,行数不多但行极长(最长1030字符)。因UTF-8编码问题(文件末尾有截断字节),先用iconv修复:

iconv -f UTF-8 -t UTF-8 -c 十先生奥论注.txt > /tmp/ssxs_fixed.txt

Step 2: 5轮关键词grep

第1轮:核心词

关键词匹配数有效服饰条目
衣裳11
衣冠32
73
22
20
00
佩玉11
玉带00
62
00
00
120(皆"履行"等非服饰用法)
00
00
00
00
00
20
20
140

第2轮:材质词

关键词匹配数有效服饰条目
20
00
10
101
00
10
80
00
10
20
171
布衣41
50
00

第3轮:色彩纹饰词

关键词匹配数有效服饰条目
紫绯00
赐绯00
201(朱紫)
141(青紫)
32
21
单字颜色词(白35、黄44、丹9等)全部为非服饰用法,未提取。

第4轮:制度词

关键词匹配数有效服饰条目
赐服00
赐绯00
章服00
冠服00
朝服00
丧服11(冠昏丧祭)
42(衮冕)
服制00
"衮"4处中2处为"衮衮"(滚滚)用法,已排除。

第5轮:配饰词

关键词匹配数有效服饰条目
10
00
00
00
00
80
霞帔00
云肩00
佩鱼00
幞头00

Step 3: 补充搜索

# 官服品色
rg -n '青紫|朱紫|貂蝉|冠带|搢绅' /tmp/ssxs_fixed.txt
# 结果:约5条

# 赐服
rg -n '绶|赐.*衣|解衣|佩.*绶' /tmp/ssxs_fixed.txt
# 结果:约3条

# 礼制
rg -n '冠昏丧祭|垂衣裳|衮冕|黼黻' /tmp/ssxs_fixed.txt
# 结果:约5条

Step 4: 筛选与分类

根据提取结果:

Step 5: 对抗式审查

Step 6: 对比列朝诗集

维度列朝诗集十先生奥论注
有效服饰条目350-400条15-20条
具体服饰描写大量
服饰哲学论述1条(L462)
官服品色丰富少量
民族服饰丰富
女性服饰丰富
配饰丰富极少

输出文件

文件说明
十先生奥论注_原文提取.md按分类整理的服饰相关原文,约15-20条
十先生奥论注_总结.md服饰内容分析总结
十先生奥论注_日志.md本处理日志

统计摘要