《独断》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《独断》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/part3/独断.txt(363行,38609字节)


Step 1: 文件信息确认

```bash wc -l -c /home/z/my-project/upload/part3/独断.txt

结果:363行,38609字节

```

Step 2: 第1轮grep — 核心服饰词全搜

```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 独断.txt

结果:约60行命中,服饰内容极其集中

```

命中分布:

Step 3: 误命中审查与排除

Step 4: 第2轮grep — 制度动作词

```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 独断.txt

结果:0行命中(汉代制度书无唐以后制度词)

```

Step 5: 第3轮grep — 组合扩展词

```bash rg -n '蚕|桑|茧|缫|织|纺|衮冕|鷩冕|毳冕|絺冕|玄冕|软脚|硬脚|展角|乌纱' 独断.txt

结果:行160"桑扈氏"→官名排除

本轮无新增有效服饰命中

```

Step 6: sed上下文提取

对核心区段执行sed提取: - 行328-358(冕冠制度全谱):提取约30行,涵盖冕冠、通天冠、远游冠、进贤冠、法冠、武冠、帻等全部冠服制度 - 行312-320(卤簿与车服制度) - 行296-302(宗庙衣冠制度)

Step 7: 分类与输出

有效服饰命中:约35条(丰富级别) 按7类整理:冕冠制度/诸冠名目/帻的演变/车服卤簿/朝服品阶/宗庙衣冠/礼仪服饰


操作流程轨迹

文件确认(363行/39KB) → 第1轮核心词grep(~60行命中) → 误命中审查排除(~3条) → 第2轮制度词grep(0行) → 第3轮扩展词grep(0新增) → sed上下文提取(核心区328-358等) → 分类归纳(7类35条) → 三MD输出

关键发现

审核结果