《香天谈薮》服饰内容提取 · 工作日志

时间:2026-04-18 任务:从《香天谈薮》TXT中提取全部服饰相关内容 输入:/home/z/my-project/upload/part4/香天谈薮.txt 输出目录:/home/z/my-project/upload/4笔记output/香天谈薮/


操作流程

Step 0: 文件基本信息

文件大小:17,734 字节 行数:43 行 格式:纯文本,中文笔记体 作者:清·吴雷发 内容:花木品评、诗文评论、梦境记述、才女轶事等文人随笔

文件体量小(<20KB),但仍按规范执行grep-first策略,不整本载入做全量分析。

Step 1: 第一轮检索——核心服饰词(112词)

rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' INPUT_FILE

命中行:3, 13, 15, 18, 19, 28, 29, 30, 31, 32, 35, 39, 41(共13行)

Step 2: 第二轮检索——制度动作词(15词)

rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' INPUT_FILE

命中行:0行(无任何制度性词汇命中)

Step 3: 第三轮检索——补充搜索

rg -n '裙|靴|鞋|袜|裘|袍|氅|褂|纱|帛|绫|缎|缂丝|布|蚕|桑|茧|缫|织|纺' INPUT_FILE - 第20行:"纱窗"→纱=窗纱,非服饰 - 第31行:"裘夏"→人名,非服饰

rg -n '妆|梳|钿|翠|金|银|珠|玉|脂|粉|黛' INPUT_FILE - 多行命中,但绝大多数为文学意象(玉碎、黄金、银缸等),非服饰 - 第3行"洗妆"=花木洗妆,非人物梳妆 - 第13行"翠被"=翠色被褥,床上用品非穿用服饰 - 第30行"盛妆饰"=临终盛妆,有效命中

Step 4: 排除审查

按词库排除规则表逐条审查:

命中词 原文语境 判断 理由
袂(第3行) "加袂成行觅斧斤" ❌排除 葬花诗中"袂"代指人(持斧者),纯比喻
衫(第13行) "碧衫少年" ✅保留 具体服饰描写:绿色衫衣
衣+绣(第13行) "美人衣绣绿者" ✅保留 穿着绣花绿衣
袂(第13行) "舞者扬袂而歌" ✅保留 举袖动作,服饰行为
簪+帽(第13行) "簪余帽上" ✅保留 簪=首饰,帽=首服
罗+衣(第15行) "添得罗衣立画郎" ✅保留 罗衣=丝织衣物
纨(第15行) "童纨扇上" ❌排除 纨扇=团扇,非服饰
绣(第15行) "绣囊""绣帘" 绣囊✅/绣帘❌ 囊=佩饰;帘=帘幕非服饰
绮+罗(第18行) "绮罗香" ✅保留 泛指女子丝衣之香
簪(第18行) "簪花拟学卫夫人" ✅保留 簪=发饰(虽为书法比喻)
锦(第18行) "锦缆" ❌排除 锦缆=缆绳,非服饰
半臂(第19行) "半臂借君凉亦暖" ✅保留 全书唯一具名服饰
青衫(第28行) "青衫如故" ✅保留 文人青衫,典故化用但含服饰信息
锦(第28行) "残红碎锦" ❌排除 比喻义,非服饰
裳(第28行) "蓉裳" ❌排除 楚辞式文学意象
绣(第29行) "绣户" ❌排除 绣户=雕饰门第,非服饰
妆饰(第30行) "盛妆饰" ✅保留 梳妆打扮,临终盛装
缟+衣(第30行) "缟衣拭泪" ✅保留 白绢素服
环+佩(第30行) "环佩西湖口" ✅保留 玉佩首饰
丝(第30行) "红丝自经" ❌排除 丝绳用于自缢,非服饰
裘(第31行) "裘夏(樵)" ❌排除 人名
绢(第32行) "白绢大书" ❌排除 绢作书写材料
青衣(第35行) "青衣女侍" ✅保留 青衣=婢女,含服饰渊源
纨(第39行) "纨纨" ❌排除 人名(叶纨纨)
纨(第41行) "小纨" ❌排除 人名字号

最终确认有效段落:7处,涉及第13、15、18、19、28、30、35行

Step 5: 分类整理

按服饰内容性质分为: 1. 梦境服饰画面(第13行)——碧衫、绣衣、袂、簪帽 2. 闺阁诗衣(第15行)——罗衣 3. 绮罗簪花(第18行)——绮罗、簪花 4. 半臂写实(第19行)——半臂 5. 文人青衫(第28行)——青衫 6. 殉情盛妆(第30行)——妆饰、缟衣、环佩 7. 侍女青衣(第35行)——青衣

Step 6: 产出文件


关键发现

  1. 服饰内容极度稀少:全书约17,700字,有效服饰信息约120字,占比<1%
  2. 无任何制度性记载:第二轮制度词检索零命中,无品服、赐服、服色等内容
  3. 唯一具名服饰为"半臂":其余均为文学意象或典故化用
  4. 全部为诗文语境:7处有效命中无一出现在议论或纪实段落中
  5. 此书性质决定服饰稀缺:作者关注花木品赏与才女诗文,服饰非其兴趣所在

审核结果

全部通过 ✅ - 原文均从TXT文件grep提取,有明确行号对应 - 排除规则严格执行:人名(裘夏、纨纨、小纨)、比喻(锦缆、绣户、白绢)、非服饰(纱窗、翠被)均予排除 - 有效段落7处均经逐词审查确认