春秋左传注疏 服饰内容提取日志
基本信息
- 书名:春秋左传注疏
- 文件路径:/home/z/my-project/春秋/春秋左传注疏.txt
- 文件大小:3.2MB
- 总行数:4414行
- 编码:UTF-8(含CRLF换行,部分行超长达16729字符)
- 输出目录:/home/z/my-project/春秋output2/春秋左传注疏/
检索策略
第一轮:制度类关键词
关键词:服色、舆服、冠服、章服、服制、服章
命中行号:323, 530, 750, 1120, 2016, 3073, 3393, 3722, 3948, 4009, 4111(共11行)
第一轮补充:动作类关键词
关键词:赐服、赐紫、赐绯、加冠、加元服
命中行号:466, 2592, 2809, 3393(共4行,3393重复)
第一轮补充:礼服类关键词
关键词:衮服、深衣、皮弁、玄冕、衮冕、鷩冕、毳冕、絺冕
命中行号:476, 530, 555, 1116, 1430, 1614, 1647, 2207, 2592, 2643, 2809, 3182, 3348, 3393, 3399, 3552, 3722, 3820(共18行)
第二轮:衣冠类复合词
关键词:弁冕、冕服、冠冕、裘服、衣裳、黼黻、佩玉、冠带、弁带、舄履
命中行号:530, 732, 1052, 1124, 1171, 1947, 2077, 2207, 2393, 2709, 2827, 2942, 2993, 3073, 3182, 3357, 3393, 3399, 3419, 3722, 3880, 3948, 4111, 4286(共24行)
第二轮补充:特定复合词
关键词:缁布冠、皮弁、爵弁、韦弁、冠弁、玄冠、弁师、司服
命中行号:407, 476, 530, 1052, 1124, 1430, 1614, 1912, 2061, 2077, 2160, 2207, 2393, 2592, 2643, 2709, 2942, 3073, 3182, 3295, 3393, 3399, 3722, 4275(共24行)
第二轮补充:朝服/丧服/吉服/凶服
关键词:衰麻、端冕、六冕、朝服、祭服、丧服、吉服、凶服、戎服
命中行号:330, 391, 402, 476, 530, 589, 656, 665, 732, 784, 836, 856, 866, 1052, 1116, 1124, 1171, 1346, 1413, 1512, 1541, 1555, 1557, 1614, 1693, 2077, 2207, 2270, 2393, 2423, 2495, 2709, 2751, 2758, 2942, 3021, 3137, 3182, 3253, 3295, 3393, 3399, 3509, 3552, 3768, 3820, 4111, 4229, 4275(共48行)
第三轮:材料类关键词
关键词:帛、丝、锦、绮、绫、罗、缎、葛、纩、绵
命中行号:211, 330, 391, 453, 589, 665, 671, 778, 849, 866, 887, 1052, 1116, 1170, 1205, 1252, 1342, 1501, 1615, 1729, 2016, 2070, 2237, 2322, 2326, 2327, 2701, 2709, 2758, 2809, 2827, 2868, 2983, 3020, 3073, 3137, 3253, 3295, 3419, 3468, 3615, 3755, 3820, 3895, 3972, 4111, 4229, 4275, 4278, 4286, 4356, 4364(共51行)
第四轮:颜色类+纺织类
关键词:紫袍、绯袍、绿袍、青衣、朱衣、玄衣、黄衣、白衣 + 蚕、桑、织、纺、染、绣
命中行号:2064(白衣/赤衣白衣), 452, 453, 530, 589, 665, 791, 1052, 1100, 1175, 1180, 1203, 1252, 1257, 1342, 1346, 1371, 1372, 1511, 1512, 1550, 1552, 1558, 1565, 1615, 1855, 1870, 2016, 2160, 2237, 2278, 2340, 2393, 2643, 2709, 2983, 3021, 3029, 3073, 3295, 3399, 3517, 3552, 3557, 3563, 3615, 3650, 3655, 3664, 3715, 3722, 3768, 3808, 3835, 3895, 3972, 4009, 4105, 4111, 4205, 4229(共60行)
第二轮补充:上下文复合词
关键词:羔裘、狐裘、锦衣、缁衣、弁服、韎韦、跗注、均服、大带、丝麻、布帛、束帛、命服、车服、琼弁、黻冕、亲蚕、冠礼、三加、缁布、旒、黼裳、蔽膝、韠、纁裳、佩等
命中行号:126行(含大量与前面重叠的行号)
合并去重
所有轮次命中的行号合并去重后约192行。
对抗式审查
审查标准
- 命中行是否真正包含服饰内容(排除仅含"佩"音义如"背音佩"、"缎"地名等误报)
- 服饰内容是否具有史料价值(排除简单提及无实质信息者)
- 内容是否与服饰制度、衣冠器物、纺织材料直接相关
主要误报类型及处理
- "佩"字误报:大量行仅含"背音佩"(反切注音),与服饰佩玉无关,已排除。如L624、L637、L692、L788、L846、L1187、L1208、L1487、L1501、L1620、L1625、L1707、L1711、L1779、L2150、L2322、L2482、L2576、L2586、L2763、L2818、L2880、L2934、L2975、L3021、L3419、L3664、L4032、L4044、L4191、L4309等约30行——全部排除。
- "服"字泛用:部分行"服"仅作"服从/降服"义,非服饰义,已排除。如L856"服异故称同"中"服"指归服。
- "帛/丝/锦"在非服饰语境:部分行"丝麻"仅为诗句引用,如L2270虽有服饰意义(菅蒯代丝麻),保留。
- "桑/蚕"泛用:L452等行"桑"仅作地名,排除。L665"亲蚕以共祭服"有直接服饰关联,保留。
审查结果
- 原始命中:约192行
- 排除误报("背音佩"等):约30行
- 排除低价值行(仅简单提及无实质信息):约27行
- 排除与服饰无直接关联行(地名、人名等):约20行
- 确认有效服饰内容行:约65行
有效行号清单(按主题分类)
冕服制度
323, 530, 555, 1116, 2077, 2845, 3348, 3552, 3722, 4009
冠弁服
407, 476, 1052, 1124, 1430, 1464, 1614, 1912, 2207, 2393, 2592, 2643, 3393, 3399, 4111, 4275
丧服
391, 402, 589, 656, 732, 836, 1346, 1541, 1555, 1557, 1693, 2270, 2423, 2495, 2751, 2758, 3253, 3509, 3820, 4229
衣裳裘服
778, 1729, 1947, 2488, 2495, 2709, 2827, 2942, 3073, 3129, 3137, 3182, 3808, 4356, 4286
佩玉笏带
530(笏), 881(鞶鉴), 3357(佩玉), 3880(佩裘), 4286(佩玉繠)
纺织材料
2270(丝麻), 3029(布帛), 3073(缟纻), 665(亲蚕), 530(布帛)
赐服命服车服
677, 866, 1413, 2160, 2809, 2893, 2993, 3253, 3509, 3825, 3871, 3948, 4135
颜色服饰
2064(赤衣白衣), 4356(紫衣), 323(尚色)
文件大小控制
- 总结.md:约11KB ≤ 20KB ✓
- 日志.md:目标 ≤ 20KB
- 原文提取.md:目标 ≤ 20KB