《事物纪原》服饰整理操作日志
基本信息
- 源文件:/home/z/my-project/upload/part1_extracted/事物纪原.txt
- 文件大小:416360字节(约406KB)
- 输出目录:/home/z/my-project/upload/p1output/事物纪原/
- 操作时间:2026-03-04
第一阶段:文件检查
wc -c 检查文件大小:416360字节,未超500KB,但仍采用grep提取策略
- 创建输出目录
第二阶段:五轮关键词grep
第一轮:核心词(15个)
| 关键词 |
命中行数(去重后约) |
主要分布 |
| 衣 |
~60行 |
行20,349,993-1082(集中),3077,3586等 |
| 裳 |
~8行 |
行994-1029 |
| 冠 |
~30行 |
行914-960(集中),1003,1322等 |
| 冕 |
~12行 |
行918-930,960,997,1055,1063 |
| 巾 |
~12行 |
行940,949-952,1015,1198等 |
| 帽 |
~7行 |
行941-948,1015,1081 |
| 袍 |
~4行 |
行296-297,1005,1322 |
| 衫 |
~12行 |
行297,355,1006-1031 |
| 裙 |
~9行 |
行948,1015,1019-1029,1081 |
| 裘 |
~3行 |
行20,998-999,1081 |
| 带 |
~20行 |
行20,355,993,1032-1069 |
| 佩 |
~7行 |
行216,1044-1061,1320 |
| 履 |
~8行 |
行960,1070-1077 |
| 舄 |
~2行 |
行1070-1071,1079 |
| 靴 |
~3行 |
行1015,1072-1073,1158 |
第二轮:制度词(10个)
| 关键词 |
命中行数 |
说明 |
| 服色 |
1行 |
行1322(专条) |
| 舆服 |
~15行 |
多为引书名 |
| 冠服 |
0行 |
无独立条目 |
| 章服 |
2行 |
行1319-1322 |
| 朝服 |
6行 |
行869,1002-1003,1017,1025,1055,1071 |
| 祭服 |
2行 |
行1055,1071 |
| 丧服 |
3行 |
行3172-3193 |
| 吉服 |
0行 |
无 |
| 常服 |
4行 |
行297,1003,1015,1079 |
| 公服 |
2行 |
行349,1004-1005 |
第三轮:材质词(15个)
| 关键词 |
命中行数 |
说明 |
| 丝 |
~20行 |
多为"丝麻""丝履""蚕丝"等 |
| 帛 |
~12行 |
布帛、缣帛、染帛等 |
| 绢 |
5行 |
行940,954,958,1081,2852 |
| 锦 |
~8行 |
多为"锦带前书"(书名),锦工、绫锦坊等 |
| 绮 |
0行 |
无命中 |
| 绫 |
3行 |
行1069,2008-2009,2365 |
| 罗 |
~8行 |
皂罗、紫罗、皂罗等 |
| 缎 |
0行 |
无命中 |
| 绸 |
0行 |
无命中 |
| 缂丝 |
0行 |
无命中 |
| 葛 |
~10行 |
多为葛天氏、诸葛等非服饰义 |
| 麻 |
~8行 |
丝麻、麻皮、麻纸等 |
| 布 |
~10行 |
布帛、缁布冠、布衣等 |
| 褐 |
2行 |
行2624僧褐、1081驼褐 |
第四轮:品色词(10个)
| 关键词 |
命中行数 |
说明 |
| 紫袍 |
1行 |
行1322 |
| 绯袍 |
0行 |
无独立命中 |
| 绿袍 |
0行 |
无独立命中("緑袍"在行1158) |
| 赐紫 |
3行 |
行1061,2564,2622 |
| 赐绯 |
2行 |
行353,1061 |
| 鱼袋 |
3行 |
行353,1060-1061 |
| 笏 |
7行 |
行356-357,1062-1067,1158 |
| 幞头 |
2行 |
行939-940,958 |
| 金带 |
3行 |
行355,1034-1035,1061 |
| 玉带 |
1行 |
行1061 |
第五轮:配饰词(12个)
| 关键词 |
命中行数 |
说明 |
| 旂 |
3行 |
行775,804,890 |
| 旗 |
~10行 |
多为旗旐部 |
| 章 |
~10行 |
多为章节、章服、文章等 |
| 珮 |
0行 |
无(用"佩"字) |
| 环 |
5行 |
行1033,1036-1037,1039,1041 |
| 玦 |
0行 |
无命中 |
| 簪 |
0行 |
无(用"簮"字) |
| 钗 |
3行 |
行965-968,1019 |
| 钿 |
2行 |
行980-981 |
| 翠 |
4行 |
行974,976,978,1019 |
| 珠 |
~5行 |
多为珠玉、珍珠等 |
| 玉 |
~20行 |
极多,多为人名地名等 |
第三阶段:上下文提取
对命中的关键行用 sed -n 'start,endp' 提取前后各5行上下文:
- 行914-990(冠冕首饰部全文)
- 行993-1082(衣裘带服部全文)
- 行3074-3100(蚕丝织布段)
- 行294-300(御袍段)
- 行347-358(赐服/借绯借紫段)
- 行1318-1324(章服/服色段)
- 行1825-1832(尚衣段)
- 行2005-2012(绫锦段)
- 行2562-2570(道紫段)
- 行2620-2628(僧紫僧褐段)
- 行3584-3600(布帛杂事部)
- 行3300-3308(衣甲抹额段)
- 行3170-3196(丧服段)
第四阶段:分类整理
按七大类整理:
1. 冠冕首服(32目)
2. 衣裳服制(17目)
3. 佩饰腰带(9目)
4. 履鞋体系(5目)
5. 布帛染织(7目)
6. 服色品级(9目)
7. 妇人妆饰(8目)
8. 丧服体系(3目)
加散见17条,共约88个服饰条目
第五阶段:对抗式学术审查
执行16条关键引文的grep验证,全部通过。发现5处学术问题(见总结MD)。
第六阶段:产出
- 事物纪原_总结.md — 结构化综述+学术审查
- 事物纪原_日志.md — 本文件
- 事物纪原_原文提取.md — 带行号的原始服饰匹配片段
统计
- 匹配关键词数:62个(五轮共62个词,其中6个零命中:冠服、吉服、绮、缎、绸、缂丝、珮、玦、簪、绯袍)
- 实际命中关键词数:52个
- 提取记录数:约88个服饰条目
- 三篇MD各自大小:见最终报告