班马异同论 — 服饰信息提取日志
处理信息
| 项目 | 内容 |
|---|---|
| 输入文件 | /home/z/my-project/upload/zhengshi/正史/班马异同论.txt |
| 输出目录 | /home/z/my-project/upload/正史重制output/班马异同论/ |
| 处理时间 | 2026-05-23 05:14:34 |
| 原文总行数 | 975 |
| 原文总字节 | 513,521 |
| 处理方法 | Python3 re模块逐行匹配,非整本载入LLM |
关键词列表
冠帽类(44行)
冠/冕/弁/帻/巾/帽/幞头/进贤冠/武冠/通天冠/远游冠
衣裳类(61行)
衣/裳/袍/衫/袄/褐/裘/深衣/中衣/襦/裙/裤/半袖
服制类(13行)
衮服/冕服/朝服/祭服/常服/公服/法服/章服/燕服/丧服/服制/冠制/品色/服色/冠带
颜色类(111行)
紫/绯/绿/青/黄/白/黑/朱/赭/赐紫/赐绯/借紫/借绯/赐服
配饰类(29行)
佩/笏/带/绶/鱼袋/鞶囊/香囊/簪/钗/步摇
仪制类(2行)
舆服/车服/卤簿/仪仗
织物类(38行)
帛/绢/绮/绫/罗/锦/缎/纱/绸/缯/缟/纨
命中行号一览
全部命中行(180行)
行号: 5, 11, 12, 13, 14, 15, 16, 17, 20, 21, 22, 31, 37, 39, 45, 47, 54, 61, 72, 73, 81, 87, 88, 89, 90, 96, 97, 98, 99, 104, 105, 106, 107, 108, 113, 114, 120, 121, 127, 134, 135, 142, 150, 158, 159, 163, 167, 171, 173, 174, 179, 180, 183, 185, 187, 188, 189, 190, 191, 205, 222, 224, 227, 234, 240, 241, 244, 251, 252, 261, 262, 274, 276, 302, 306, 314, 327, 328, 348, 364, 366, 369, 376, 382, 384, 409, 423, 425, 427, 457, 471, 474, 475, 476, 477, 483, 486, 487, 496, 503, 511, 517, 523, 526, 527, 528, 537, 540, 541, 551, 557, 558, 577, 580, 614, 624, 646, 647, 649, 655, 660, 675, 679, 694, 696, 713, 729, 733, 735, 737, 743, 749, 755, 759, 760, 788, 808, 820, 822, 836, 843, 866, 870, 871, 879, 895, 896, 898, 900, 901, 907, 908, 909, 910, 918, 919, 923, 924, 930, 931, 932, 933, 934, 939, 940, 942, 949, 950, 951, 952, 953, 955, 957, 958, 959, 960, 962, 967, 968, 975
高价值实质服饰行(109行,排除纯颜色命中)
行号: 5, 11, 13, 15, 17, 20, 21, 22, 31, 37, 39, 45, 47, 54, 61, 73, 81, 87, 88, 89, 90, 96, 97, 98, 99, 105, 106, 107, 108, 113, 114, 120, 121, 127, 134, 135, 142, 150, 158, 159, 163, 167, 171, 174, 183, 190, 191, 205, 234, 261, 274, 306, 314, 327, 369, 382, 425, 427, 457, 483, 527, 557, 558, 577, 614, 624, 655, 675, 729, 733, 735, 743, 755, 759, 760, 808, 820, 822, 836, 843, 870, 871, 895, 898, 901, 907, 908, 910, 923, 930, 931, 932, 934, 939, 940, 942, 949, 950, 952, 953, 955, 957, 958, 959, 960, 962, 967, 968, 975
处理步骤记录
1. ✅ wc -l: 975行
2. ✅ grep -c: 180行命中(含所有关键词类别)
3. ✅ grep -n: 提取180行行号
4. ✅ sed上下文: 提取命中行及前后各1行上下文
5. ✅ 分类统计: 7大类分别统计
6. ✅ 高价值筛选: 排除纯颜色噪声,保留109行实质服饰内容
7. ✅ 撰写3份MD
8. ✅ 写入输出目录
注意事项
- 颜色类命中111行,但多数为地理/人名中偶然出现(如"青州""黄屋"等),需结合上下文判断
- 织物类中"缯"出现较频,多与灌婴"贩缯"有关
- 冠帽类中"冠"字多出现在"冠军侯""冠冕"等复合词中
- 本书为班马异同比较,服饰信息多为零散片段,无专章讨论服饰制度