《烟屿楼笔记》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《烟屿楼笔记》全部服饰相关内容,整理分类总结


Step 1: 文件信息

```bash wc -l -c 烟屿楼笔记.txt

结果:1073行,188822字节(约184KB)

```

Step 2: 第1轮grep — 核心服饰词

```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 烟屿楼笔记.txt

结果:约40行命中,经审查保留25条有效服饰内容

```

Step 3: 第2轮grep — 制度动作词

```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 烟屿楼笔记.txt

结果:2行命中(行13、21),均为政治僭越语境,与服饰无关——排除

```

Step 4: 第3轮grep — 组合扩展词

前两轮已获得丰富内容(25条有效命中),无需再搜扩展词。

Step 5: 排除审查

关键词 误命中场景 处理
"罗隐" 人名罗隐秀才 排除
"锦绣万花谷" 书名 排除
"罗列" 排列义 排除
"衣钵" 传法义 排除
"衣冠"代指士大夫 "缙绅家" 保留——仍有服饰信息
"麻制" 无命中
"锦"地名 "锦州""锦城"无命中
"环" 无首饰义命中
"服丧/服药" 无命中
"领"动词义 "领兵""领命"等 排除
"带"动词义 "带领""连带"等 排除
"佩"心理义 "钦佩"等 排除

Step 6: sed提取关键段落

bash sed -n '93,97p' 烟屿楼笔记.txt # 灶神服饰 sed -n '399,405p' 烟屿楼笔记.txt # 花花孝 sed -n '551,560p' 烟屿楼笔记.txt # 布衣/服饰夸耀 sed -n '573,578p' 烟屿楼笔记.txt # 衣狐裘 sed -n '601,620p' 烟屿楼笔记.txt # 蝉鬓/毡帽/束带/竹衫/裁衣/草履/古冠/袜制 sed -n '649,655p' 烟屿楼笔记.txt # 赤足/穿耳/白衣冠 sed -n '717,722p' 烟屿楼笔记.txt # 卉服 sed -n '803,807p' 烟屿楼笔记.txt # 匹绢

Step 7: 分类整理

按7大类分组:首服考据、体服考据、足服考据、佩饰与腰带、丧服与丧仪、服饰风俗与社会、神灵服饰

Step 8: 生成三份文件


操作流程轨迹

文件信息1073行/184KB → 第1轮核心词grep约40行命中 → 审查保留25条 → 第2轮制度词grep2行命中(均为僭越义,排除) → 无需第3轮 → sed提取8段关键上下文 → 分类7大类 → 保存3份文件

关键发现