《媚史》服饰内容提取 · 操作日志

时间:2026-04-20 任务:提取《媚史》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/part2/媚史.txt(697行,866KB)


操作流程

Step 0: 读取参考模板

读取 /home/z/my-project/upload/参考/总结.md → 《吕氏春秋》服饰总结,9大类
读取 /home/z/my-project/upload/参考/日志.md → 《晋会要》操作日志
读取 /home/z/my-project/upload/参考/原文提取.md → 《天工开物》原文提取

确认格式:总结.md按分类章节+引用+注释+总表;日志.md按步骤+关键发现+踩坑+审核;原文提取.md按分类+带行号引用。

Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/2小说output/媚史/
→ 成功

Step 2: 检查源文件

file 媚史.txt → UTF-8 text, CRLF, very long lines (5269)
wc -l → 697行
wc -c → 866,507字节

发现编码问题:ripgrep和bash grep均报UTF-8解码错误。用Python重新读取并替换错误字符后写入临时文件。

Step 3: 第1轮grep — 基础服饰词

关键词: 衣|裳|裘|冠|冕|弁|帽|巾|袍|裙|袂|褐|衫|褂|襦|袴|裤|帔|履|靴|舄|鞋|袜
结果: 160行匹配

主要命中: - L12: 衲衣(乞丐服饰) - L41: 红衣女子 - L54: 旧布裙典当 - L66: 鞋袜道袍、巾帻 - L90/233: 缟素 - L124: 尖顶破檐帽→高巾阔服 - L131: 衣服晒窗 - L146: 礼物中丝绸布匹 - L154: 衫裁艾虎 - L173: 绵花草褥 - L180: 道袍、扣身小衣 - L194/195: 毡帽、花布包袱 - L202: 青丝委角巾帻、绿锦道袍 - L209: 锦帕、公服里衣 - L237: 红衣壮士 - L292: 毡笠、皂布敞衣、麻鞋 - L304: 紫绒扎巾/缎服、青纱巾帻/道袍、紫金冠/锦道袍 - L317: 褊衫、战袄 - L353: 扁巾、素服 - L416: 白布衲衣、紫衫 - L646: 乌纱、蟒服、玉带、皂靴、凤冠霞帔 - L648: 冠帔

假阳性排除: - "衣"字大量出现在"衣粮""衣囊""衣服""穿了衣服"等日常用语中,仅部分有服饰描写价值 - "冠"出现在"冠军""冠以"等非服饰语境 - "履"出现在"履祸基"(踩踏义,非鞋履) - "褐"主要出现在"毛褐"(礼物)和"草褐"中

Step 4: 第2轮grep — 丝织品词

关键词: 锦|绮|帛|绢|绫|罗|缎|绸|纱|缂丝|缯|纨|素|丝
结果: 160行匹配

主要命中: - L8: 绒缎银(贸易商品) - L94: 绢帛(祭礼) - L146: 土绸、土绢(赠礼) - L202: 绿锦道袍、青罗伞盖 - L209: 锦帕 - L236: 素绢、土布(赙仪) - L247: 土绸、毛褐(苗洞贺礼) - L304: 细绫柳绿道袍、红锦道袍、玄色缎服

假阳性排除: - "丝"大量出现在"一丝""丝线"等非服饰语境 - "素"大量出现在"素服""素日""素来"等 - "罗"出现在人名、地名等 - "锦"出现在"锦鸳""锦障"等比喻性用法

Step 5: 第3轮grep — 等级服色词

关键词: 舆服|服色|冠服|章服|法服|朝服|祭服|常服|公服|吉服|丧服|品色|赐紫|赐绯|借紫|借绯
结果: 仅4行匹配

命中: - L209: 公服里衣("公服"为官员制服) - L225: 无实质服饰内容 - L372: 公服升堂 - L416: 无等级服色内容

分析:世情小说无制度性服饰记载,此轮命中率极低为正常现象。

Step 6: 第4轮grep — 配饰词

关键词: 笏|鱼袋|革带|玉带|金带|银带|幞头|凤冠|步摇|簪|钗|钏|镯|佩|玉佩|霞帔|帔帛|披帛
结果: 32行匹配

主要命中: - L154: 钗袅朱符 - L305: 数珠、金钏 - L620: 簪子定情 - L631: 簪缨不绝 - L646: 凤冠霞帔、玉带 - L648: 冠帔

假阳性排除: - "佩"出现在"佩刀""佩服"等非服饰语境 - "钗"仅L154"钗袅朱符"为有效服饰用法 - "簪"出现在"簪缨"(比喻性)和"簪子"(实物)两种语境

Step 7: 第5轮grep — 纺织材料词

关键词: 绵|布|葛|麻|苎|棉|染|织|绣|纹|黼|黻
结果: 124行匹配

主要命中: - L54: 旧布裙 - L131: 衣服 - L173: 绵花 - L195: 西洋花布 - L236: 土布 - L292: 皂布、麻鞋

假阳性排除: - "布"大量出现在"宣布""分布""花布"等 - "织"出现在"组织""编织"等非纺织语境 - "纹"出现在"纹缕"(雕刻纹路)等 - "绣"出现在"刺绣"(活动)中,L353/354"刺绣"为女工活动而非服饰 - "染"出现在"染病""染了怔忡"等非染色语境 - "麻"出现在人名"麻斗西"中 - "绵"出现在"绵纸"(材料)中,非绵衣

Step 8: 上下文提取

对筛选出的有效行号,用Python提取前后各1-2行上下文,共提取约30个有效服饰片段。

Step 9: 分类整理

按以下6大类整理: 1. 人物服饰描写(18条) 2. 服饰作为礼物与商品(6条) 3. 节令与民俗服饰(1条) 4. 配饰(4条) 5. 宗教与特殊服饰(2条) 6. 纺织材料与日常衣物(3条)

Step 10: 对抗式学术审查

审查要点: 1. ✅ "扣身小衣"为口语表达,非制度名称 → 标注为日常内衣 2. ✅ "红衣""缟素"为色彩标记,非服饰类型 → 保留但在总结中注明 3. ✅ "簪缨不绝"为比喻 → 标注非实指 4. ✅ "绒缎银"为货币而非实物 → 在总结中纠正 5. ✅ 全书设定唐代但服饰描写均为明代特征 → 重点标注时代错位 6. ✅ L131"衣服晒窗"为情节推动而非服饰描写 → 保留但降低权重 7. ✅ L84/86"穿了衣服"为日常用语 → 排除


关键发现

  1. 全书最完整的服饰变迁:L124全伯通从"尖顶破檐帽+旧道袍"到"高巾阔服",反映明代社会衣冠与地位的直接关联
  2. 最完整的行者装束:L292关赤丁的毡笠+敞衣+手巾+麻鞋,为明代行旅商人标准形象
  3. 最高等级冠服:L646瞿琰婚礼的乌纱+蟒服+玉带+皂靴+凤冠霞帔
  4. 纺织品作为社交媒介:土绸、土绢、草褐、毛褐等地方纺织品在官场赠礼中占重要地位
  5. 明代服饰投射唐代:所有服饰描写均反映明代而非唐代特征
  6. 缺乏制度性记载:世情小说的服饰描写完全服务于文学叙事,无舆服志式内容

关键踩坑记录


审核结果

全部通过 ✅ — 原文均从源文件Python grep提取,有明确行号对应。假阳性已逐一排除。时代错位问题已在总结中标注。