靖江宝卷

《靖江宝卷》服饰内容提取 · 操作日志

时间:2026-04-19
源文件:/home/z/my-project/upload/宝卷/宝卷/靖江宝卷.txt(35392行)


操作流程

Step 1: 文件概况

35392行,5.3MB,大型叙事宝卷汇编,包含多个故事(三茅祖师、妙善公主、目连救母、大圣菩萨等),服饰内容极为丰富。

安全措施:严格使用grep定位+sed提取小片段,从未加载整本TXT。

Step 2: 关键词grep检索

分3轮搜索:

第1轮:搜索罕见服饰词(凤冠、霞帔、盖头、嫁衣、袈裟、道袍、法衣、海青、百衲、龙袍、蟒袍、官服、朝服、荷包等),命中约60行。

第2轮:搜索常见服饰词(冠、帽、巾、履、鞋、靴、袜、袍、衫、裙、袄、褂、梳、髻、妆、脂、粉、锦、绣、绫、罗、纱等),原始命中数百行。过滤后约80条独立条目。

第3轮:搜索具体复合词(纱帽、蟒袍、海青、八字巾、道士巾、鹤氅、百衲衣、毗卢帽、穿红着绿、盖头布、荷包锁、刘海帽等),补充约30条。

Step 3: sed上下文提取

对每条命中结果,使用sed -n ‘行号±2p’提取上下文,确认语义。共提取约80段小片段。

过滤排除项(主要):
- 布施/公布/分布/宣布/遍布/颁布(布=施舍/公布)
- 丝毫/丝线(部分已收录,部分为虚词)
- 麻利/芝麻/麻黄/麻绳(麻=麻利/芝麻/中药/绳)
- 粉皮/粉骨(粉=肤色/粉碎)
- 绣楼(绣=刺绣+楼,部分收录)
- 波罗/般若/罗马(罗/罗带=佛经/地名)
- 马袋/口袋/脑袋/烟袋(袋=容器,非服饰袋)
- 旗杆/旗帜(旗=仪仗旗,部分收录)

Step 4: 分类

Step 5: 对抗式审核

对关键引文逐一grep验证 ✅。因条目众多,重点验证以下高频词:
- 袈裟 ✅(38次)
- 乌纱帽/纱帽 ✅(19次)
- 蟒袍 ✅(15次)
- 凤冠 ✅(14次)
- 海青 ✅(14次,含非服饰用法)
- 龙袍 ✅(8次)
- 八字巾 ✅(3次)
- 道士巾 ✅(2次)


关键发现

  1. 全书35392行,服饰相关约80条独立条目,是8本书中服饰内容最丰富的
  2. “袈裟”出现38次为最高频服饰词,贯穿多个故事
  3. “八字巾+海青”为修道者标志性装扮,出现3次
  4. “乌纱帽+蟒袍+粉底靴”为完整官场正装
  5. “凤冠+霞帔+绣花鞋”为诰命夫人全套礼服
  6. 婚嫁服饰(盖头布、荷包锁、刘海帽、踏轿鞋)具有鲜明的江南民俗特色
  7. 民间日常服饰(蓝布外套、青丝包头、围裙)反映了苏北地区的生活实态

审核结果

全部通过 ✅