《事林广记后集》服饰内容提取操作日志

基本信息


Step 0:文件检查

wc -c /home/z/my-project/upload/part1_extracted/事林广记后集.txt

结果:273694 字节。未超500KB,但仍遵铁律不整本载入LLM上下文。


Step 1:第一轮grep——核心词(15词)

grep -n "衣" 事林广记后集.txt | head -80

命中行:353, 926, 1004, 1009, 1011, 1012, 1070, 1181, 1620, 1648, 1654, 1676, 1977, 2309, 2312, 2317, 2366, 2379, 2385, 2386, 2520, 2555, 2626, 2629, 2632, 2633, 2666, 2777, 2846, 2864, 2865, 2893, 2895, 2898, 2913, 2920, 2921, 2923, 2924, 2926, 2927, 2935, 2937, 2938, 2944, 2952, 2954, 2956, 2958, 2968, 2973, 2974, 2978, 3005, 3011, 3014, 3026, 3030, 3032, 3040, 3042, 3050, 3054, 3077, 3078, 3161 等

grep -n "裳" 事林广记后集.txt | head -80

命中行:353, 926, 1004, 1784, 2317, 2379, 2390, 2552, 2555, 2865, 2899, 2901, 2923, 2926, 2978, 3042, 3451, 3452

grep -n "冠" 事林广记后集.txt | head -80

命中行:926, 1004, 1009, 1011, 1021, 1169, 1392, 1407, 1802, 1851, 1977, 1988, 2037, 2390, 2406, 2520, 2542, 2641, 2865, 2866, 2868, 2871, 2874, 2877, 2881, 2889, 2892, 2927, 2928, 2930, 2931, 2937, 2938, 2940, 2979, 2980 等

grep -n "冕" 事林广记后集.txt | head -80

命中行:292, 353, 1003, 1004, 1278, 2865, 2866, 2878, 2880, 2916, 2917, 2938, 2980

grep -n "巾" 事林广记后集.txt | head -80

命中行:999, 1012, 1794, 2552, 2632, 2708, 2931, 2940, 2941, 2942, 2971, 2972, 3216

grep -n "帽" 事林广记后集.txt | head -80

命中行:1778, 2848, 2962, 2997

grep -n "袍" 事林广记后集.txt | head -80

命中行:1794, 2944

grep -n "衫" 事林广记后集.txt | head -40

命中行:1778, 2951, 2952, 2953, 2954, 2955, 2956, 2957, 2958, 2974, 3001

grep -n "裙" 事林广记后集.txt | head -40

命中行:2974, 2977, 2978

grep -n "裘" 事林广记后集.txt | head -40

命中行:2441, 2640(均为非服饰专用语境,"裘缠质""萁裘")

grep -n "带" 事林广记后集.txt | head -60

命中行:104, 1012, 1620, 1776, 1802, 2347, 2392, 2633, 2641, 2887, 2907, 2911, 2913, 2927, 2932, 2934, 2942, 2945, 2946, 2986, 3078, 3320 等

grep -n "佩" 事林广记后集.txt | head -40

命中行:1169, 1219, 1627, 2277, 2283, 2347, 2905, 2907, 2910

履/舄

grep -n "履\|舄" 事林广记后集.txt | head -40

命中行:44, 349, 369, 371, 395, 925, 1082, 1198, 1277, 1367, 1470, 1633, 1646, 1746, 1943, 2914, 2916, 2927, 2935, 2945(其中多数为"履行"义,服饰相关为2914, 2916, 2935)

grep -n "靴" 事林广记后集.txt | head -40

命中行:2962

第一轮小结:15个核心词均有命中,服饰密集区在2864-3000行(卷十服饰类)。


Step 2:第二轮grep——制度词(10词)

grep -n "服色\|舆服\|冠服\|章服\|朝服\|祭服\|丧服\|吉服\|常服\|公服" 事林广记后集.txt
关键词 命中行
冠服 1004
常服 1012
公服 1012, 2943
祭服 1800, 2889, 2898
朝服 2895, 2952
舆服 2931, 2938, 2956, 2962
丧服 1877
服色 无独立命中
章服 无独立命中
吉服 无独立命中

第二轮小结:6词命中,4词无独立命中。


Step 3:第三轮grep——材质词(15词)

grep -n "丝\|帛\|绢\|锦\|绮\|绫\|罗\|缎\|绸\|缂丝\|葛\|麻\|布\|褐" 事林广记后集.txt | head -80

主要服饰材质相关命中:

关键词 服饰相关命中行
2880(藻贯玉为饰)、2892(青组缨)、2907(佩)、2910(组绶)、2913(其带伊丝)、2986(以丝及彩绢)
2938(染帛以效)、2982(缣帛为之)
2904(绢为里)、2935(或缯为鼻)、2940(皂绢褁发)
2895(锦衣)、2256(罗绮)
2904(以罗为表)、2982(汉即以罗)、2984(戴皂罗方五尺)
2871(漆布为壳)、2874(缁布为之)、2886(弁布漆)、2923(白细布)、2954(布深衣)、2984(凶服以布)
2938(易以丝麻)
缟/绮/绫/缎/绸/缂丝/葛/褐 服饰语境命中稀少,多为他义

第三轮小结:丝、帛、绢、罗、布、麻有明确服饰语境命中;缂丝无命中。


Step 4:第四轮grep——品色词(10词)

grep -n "紫袍\|绯袍\|绿袍\|赐紫\|赐绯\|鱼袋\|笏\|幞头\|金带\|玉带" 事林广记后集.txt
关键词 命中行
绿袍 1794
赐紫 2948(赐紫则给金鱼)
鱼袋 2947, 2948
2393, 2949, 2950
幞头 2939, 2940, 2984
紫袍 无命中
绯袍 无命中
赐绯 无命中(原文作"赐□则给银鱼",□处缺字)
金带 无独立命中
玉带 无独立命中

第四轮小结:5词命中,5词无命中。


Step 5:第五轮grep——配饰词(12词)

grep -n "旂\|旗\|珮\|环\|玦\|簪\|钗\|钿\|翠\|珠\|玉" 事林广记后集.txt | head -80
关键词 服饰相关命中行
1391, 2272, 2435, 2441, 3217, 3218, 3220, 3242, 3243
2883, 2930
2974, 2987, 2988
2989, 2990, 2991, 2992
2907(蠙珠), 2988(玉钗)
2880, 2907, 2910, 2920, 2987, 2988
2974(钗翠), 3099
无独立命中
无独立命中(原文用"佩")
无独立命中
无独立命中

第五轮小结:7词有服饰语境命中,5词无命中。


Step 6:上下文提取

对服饰密集区(行2860-3060)执行sed提取:

sed -n '2860,3010p' 事林广记后集.txt
sed -n '3010,3060p' 事林广记后集.txt

成功提取"服饰类"全文及"澣泽须知"部分。

对旗制部分(行3210-3255)执行sed提取:

sed -n '3210,3255p' 事林广记后集.txt

Step 7:对抗式学术审查

对所有拟引用原文执行grep -c验证:

grep -c "衣服仪制" 事林广记后集.txt   # 1 ✓
grep -c "冠冕之制" 事林广记后集.txt   # 1 ✓
grep -c "深衣之制" 事林广记后集.txt   # 1 ✓
grep -c "服用原始" 事林广记后集.txt   # 1 ✓
grep -c "冕服十二章" 事林广记后集.txt # 1 ✓
grep -c "赐紫则给金鱼" 事林广记后集.txt # 1 ✓
grep -c "霞帔" 事林广记后集.txt       # 2 ✓
grep -c "鱼袋" 事林广记后集.txt       # 2 ✓
grep -c "幞头" 事林广记后集.txt       # 3 ✓
grep -c "玉钗" 事林广记后集.txt       # 2 ✓
grep -c "环钏" 事林广记后集.txt       # 1 ✓
grep -c "指环" 事林广记后集.txt       # 3 ✓
grep -c "盖头" 事林广记后集.txt       # 2 ✓
grep -c "固姑" 事林广记后集.txt       # 1 ✓
grep -c "半臂" 事林广记后集.txt       # 2 ✓
grep -c "冠服制度" 事林广记后集.txt   # 1 ✓

全部验证通过,无编造内容。


Step 8:产出三篇MD


统计

指标 数值
grep关键词总数 57(5轮)
命中关键词数 48
无命中关键词数 9(缂丝、服色、章服、吉服、紫袍、绯袍、赐绯、金带、玉带)
提取服饰记录条数 约65条
服饰密集行号范围 2864-3060(卷十服饰类+澣泽须知)
散见服饰行号 1004, 1012, 1784, 1794, 3217-3255 等