《尚史》服饰内容提取操作日志
基本信息
- 文件路径:/root/.openclaw/workspace/别史/尚史.txt
- 文件编码:UTF-8
- 处理时间:2026-05-04
- 总行数:约8940行
操作流程记录
Step 1: 文件探测
wc -c: 文件字节数
wc -l: 文件行数
head -50: 查看文件开头
结果:文件为清代马骕所撰《尚史》,采摭百家杂说,上起鸿荒,下迄秦代,仿纪传体编次。
Step 2: 多轮grep提取
第1轮:衣|裳|袍|衫|裙|袄|裤|袜|履|鞋|靴|舄
- 命中行数:约200+行
- 有效服饰行:约60行
- 典型命中:衣裳(多处)、衮冕黻珽(行3018)、白衣冠(行5255)、履舄交错(行5915)
第2轮:冠|冕|弁|帽|幞头|帻|笠
- 命中行数:约200行
- 有效服饰行:约50行
- 典型命中:麻冕(行639)、雀弁(行639)、冕服(行423/1051)、弁(行3450)、冠(行3680)
第3轮:绢|绫|罗|缎|锦|绮|丝|绸|布|麻|葛|棉|苎
- 命中行数:约200行
- 有效服饰行:约40行
- 典型命中:葛布(行1653)、锦绣(行5742)、布帛(行8575)、丝(行268)、麻(行1653)
第4轮:裘|皮|貂|狐|羊|麂
- 命中行数:约200行
- 有效服饰行:约15行
- 典型命中:狐裘(行3418/4017)、皮弁搢笏(行1660)、虎豹之皮(行3933/5431)、狐皮(行1653)
第5轮:紫|绯|红|绿|青|白|黑|黄
- 命中行数:约200行
- 有效服饰行:约20行
- 典型命中:白衣冠(行5255)、尚白(行408)、上黑(行784)、彤裳(行639)、丹衣柱(行5848)
第6轮:鱼袋|笏|带|佩|簪|钗|钏|坠|环(服饰搭配筛选)
- 命中行数:约50行
- 有效服饰行:约10行
- 典型命中:佩玉(行3239/4313)、金玦(行3598)、环(行3239)、簪(行5742)
第7轮:赐服|赐紫|赐绯|借紫|借绯
- 命中行数:约10行
- 有效服饰行:约8行
- 典型命中:赐冕服(行1051)、赐三命之服(行4098)、赐先路三命之服(行4504)
第8轮:服色|品色|章服|冠服|舆服|制服
- 命中行数:约30行
- 有效服饰行:约15行
- 典型命中:服色(行408)、章服(行8570)、冕服(行423/639/1051/1319)
第9轮:染|绣|织|裁|缝|绩|纺(服饰搭配筛选)
- 命中行数:约50行
- 有效服饰行:约10行
- 典型命中:织纴(行4490)、织文(行268)、绩(行3283)、墨染其衰(行1074)
第10轮:补服|补子|文官|武官
- 命中行数:约30行
- 有效服饰行:约0行(《尚史》记载下限至秦代,无补服制度)
- 说明:补服制度始于明清,先秦典籍无此记载
Step 3: 上下文提取
对关键行号使用 sed -n '行号-5,行号+10p' 提取完整上下文段落。
Step 4: 精简筛选
- 剔除无关匹配:约150行(如"衣服"仅作比喻义、"衣食"泛指生活等)
- 保留确为服饰记载段落:约120行
- 提取内容总量:约80KB(远低于1M上限)
Step 5: 分类整理
将服饰内容归为9大类:冕服冠裳、五服五章、赐服、丧服、胡服骑射、列国风俗、政治象征、纺织织物、佩饰车马。
grep统计汇总
| 轮次 | 关键词 | 总命中 | 有效命中 |
|---|---|---|---|
| 1 | 衣裳袍衫裙等 | 200+ | 60 |
| 2 | 冕弁帽帻等 | 200 | 50 |
| 3 | 绢绫罗锦布麻葛等 | 200 | 40 |
| 4 | 裘皮貂狐等 | 200 | 15 |
| 5 | 紫绯红白黑等 | 200 | 20 |
| 6 | 佩簪环等 | 50 | 10 |
| 7 | 赐服赐紫等 | 10 | 8 |
| 8 | 服色章服冠服等 | 30 | 15 |
| 9 | 染绣织缝等 | 50 | 10 |
| 10 | 补服文官武官等 | 30 | 0 |
| 合计 | ~1170 | ~228 |
注意事项
- 《尚史》为辑录体史书,服饰记载多为引录先秦典籍原文
- 服饰内容分散于本纪、世家、列传各篇,无专篇论述
- 先秦无补服、品级等后世制度,第10轮grep无有效命中
- 颜色词(第5轮)大量为非服饰语境,需严格筛选