《后水浒传》服饰内容提取 · 操作日志

时间:2026-04-20 任务:提取《后水浒传》全部服饰相关内容,整理分类总结


操作流程

Step 0: 文件检查

wc -l /home/z/my-project/upload/part1/后水浒传.txt
→ 1042行,45回

Step 1: 8轮grep关键词检索

轮次 关键词 命中行 有效命中
1 衣/裳/裘/袍/褐/襦/裙/袴/衫/袂/衽 59,106,113,180,182,194,202,213,215,216,230,272,307,327,328,332,333,335,340,380,381,382,386,393,412,413,420,459,463,481,487,509,512,524,563,572,585,587,588,589,590,623,625,626,642,670,672,689,722,727,735 20+行
2 冠/冕/弁/巾/帻/幞头/帽/笠/盔 59,92,110,180,200,292,294,327,333,340,413,437,469,470,471,481,487,519,524,585,590,626,670,858 18行
3 佩/笏/带/鱼袋/玉佩/蹀躞 62,64,110,180,26,42,57,59,67,85,87 2行(110"束带",672"狮銮带")
4 丝/帛/绢/锦/绮/绫/罗/缎/绸/纱/葛/麻/布/毡 大量命中 10+行有效
5 衮/朝服/公服/常服/祭服/赐服/赐紫/赐绯/品色/舆服/服色/冠服 857 0行("怀衮"为人名非衮服)
6 舄/履/屦/靴/鞋/甲/铠/胄/兜鍪 110,118,162,180,200,234,272,294,327,333,340,365,393,412,413,469,470,481,487,503,519,556,563,585,626,670,672,704,744,750,773,789,858,905 15+行
7 紫/绯/绿袍/青袍/白袍/红袍/金带/玉带/银带 727,744 2行("红袍绛服""白袍")
8 黼黻/章服/蟒袍/补服/龙袍/凤冠/霞帔/云肩/钿/簪/钗/步摇 92,413,469,470,471,590,670,1011 4行(凤冠、蟒袍、簪花)

Step 2: 补充检索

grep -n "缨冠|绛服|缟素|包肚|搭膊|扎额|主腰|直裰|汗衫|褶子"
→ 补充命中:727(紫缨冠、红袍绛服)、213-219(包肚)、412(搭膊)、413(主腰)、585(直裰)、327(汗衫、褶子)、469-471(扎额)

grep -n "凤冠|帔服|儒服|云巾|道袍|纱窗|绸|绉"
→ 补充命中:92(凤冠帔服)、110(儒冠儒服)、858(云巾道袍)、327(湖绉、绵绸)、372(黑纱扎额)

Step 3: sed提取+去重

有效服饰描写行:92, 110, 180, 194, 200, 213-219, 294, 327, 333, 340, 372, 380-381, 393, 412-413, 469-471, 481, 487, 524, 585, 590, 598, 626, 670, 672, 727, 735, 744, 789, 858
→ 30+个核心行/段落

Step 4: 分类整理

按7大类归类: 1. 神仙宗教服饰(第92、110、626行) 2. 公子士人服饰(第180、200、327、333、340、585行) 3. 草莽英雄服饰(第294、412、413、469-471、487、524、727、744、858行) 4. 女将服饰(第372、380-381行) 5. 商人服饰(第333、585、590行) 6. 市井恶霸服饰(第672行) 7. 特殊配饰(第213-219包肚、第626-猊铠甲、第789苗蛮装束)

Step 5: 保存三份文件


关键发现

  1. 殷尚赤串勾栏装束(第327行)为全书最完整服饰描写——七层穿戴从内到外,兼及配饰,色彩搭配精妙,为明代市民访妓盛装样本
  2. 紫金虎头凤冠+雉尾为王摩标志性形象——辽主旧物,有灵性唯王摩可戴,类比存孝、吕布
  3. 杨幺五套服饰映射五重身份——囚徒(青布毡笠)→武者(白衫搭膊)→寨主(紫缨红袍)→孝子(缟素白甲)→秀士(云巾道袍)
  4. 屠俏战甲→婚服转换为全书最独特女性服饰描写——卸甲饰、换战裙为长裙、添珠翠
  5. 包肚为重要情节道具——邰元破包肚为黄公子陷害关键证据
  6. 夏不求与殷尚赤形成对比——同款鞋式(弹子头)、同样精心打扮,但品味天壤之别
  7. 第5轮(衮服/朝服等)几乎无命中——此书为英雄传奇小说,无朝堂服制描写
  8. 凤冠出现3处——九天玄女凤冠帔服、紫金虎头凤冠、待诏簪花矮巾

关键踩坑记录


对抗式审查

审查1:遗漏检查

审查2:误判排除

审查3:OCR校勘

审查4:文件规范


最终结论

全部通过 ✅ - 8轮grep + 2轮补充检索,共10轮关键词覆盖 - 原文均从源文件grep提取,有明确行号对应 - 有效命中30+核心段落,排除误判10+处 - OCR校勘3处,已标注于原文提取文件