目 录
《青楼集》服饰内容提取 · 工作日志
时间:2026-04-20 任务:提取《青楼集》全部服饰相关内容 任务ID:batch5-5
操作流程
Step 1: 检查文件基本信息
wc -c 青楼集.txt → 21,584字节(约21KB)
wc -l 青楼集.txt → 284行
文件较小,但仍按规范先grep后sed,不全量载入。
Step 2: 第一轮核心服饰词grep
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|...(全词库)' 青楼集.txt
命中行:13, 17, 21, 25, 51, 55, 77, 87, 111, 123, 127, 145, 159, 163, 211, 231, 235, 245, 281, 283
Step 3: 第二轮制度动作词grep
rg -n '赐服|赐紫|赐绯|...|敛衽|释服|加冠' 青楼集.txt
命中行:245(含"敛衽")
Step 4: 第三轮扩展词grep(首饰·发饰)
rg -n '髻|梳|妆|脂|粉|翠|金|玉|珠|金篦|花冠|钿|钏' 青楼集.txt
补充命中:83(妆旦色)、91(金篦)、135(丫髻)、151(角峨峨)
Step 5: 逐条审查排除
| 行号 | 关键词 | 判定 | 理由 |
|---|---|---|---|
| 13 | "云锦盖涟漪" | ❌排除 | 锦喻水波,非丝织品 |
| 17 | "锦织""海霞为带" | ❌排除 | 诗词比喻,非实物服饰 |
| 25 | "雕鞍" | ❌排除 | 鞍为马具,非人体服饰 |
| 123 | "一时之冠" | ❌排除 | 冠=最佳,非首服 |
| 127 | "四体文绣" | ❌排除 | 文绣=纹身,非刺绣衣物 |
| 145 | "朱锦绣" | ❌排除 | 人名 |
| 163 | "丝竹咸精" | ❌排除 | 丝竹=乐器 |
| 211 | "绣花" | ❌排除 | 诗句比喻 |
| 283 | "罗春伯" | ❌排除 | 人名 |
Step 6: 确认有效命中13条
- 第21行:轻衫短帽(体服+首服)
- 第51行:青衫老传(体服·诗词用典)
- 第55行:王玉带(腰带·艺名)
- 第77行:王金带(腰带·艺名)
- 第83行:妆旦色(戏曲装扮)
- 第91行:金篦刺目(佩饰·首饰)
- 第111行:侍巾栉(巾·礼仪用语)
- 第135行:丫髻(首服·发式)
- 第151行:角峨峨(首服·官员冠)
- 第159行:髻挽青螺裙拖白带(首服+体服+腰带)
- 第171行:马腰截(体服·礼品)
- 第231行:红绣鞋(足服·曲牌名)
- 第245行:帽上簪花+簪+敛衽(首服+佩饰+礼仪动作)
- 第281行:帽儿王(首服·绰号)
实际归并为14条目(第13条含帽+簪+敛衽三个要素,第14条驾头补录)。
补录:初版遗漏"驾头"(戏曲帝王冠服术语),出现3次(第17、29、45行),为本书最常见的服饰术语。对抗审查时发现并补入。
Step 7: 撰写三份文件
- 青楼集_原文提取.md → 10,023字节 ✅(≤20KB)
- 青楼集_总结.md → 4,325字节 ✅(≤20KB)
- 青楼集_日志.md → 本文件
关键发现
- 《青楼集》服饰内容极少:全书284行中仅有13条有效服饰命中,且多为诗词意象与间接描写
- 帽上簪花为最详细描写:刘婆惜条中全普庵拨里"帽上常喜簪花"的记载,是元代文官风雅习俗的珍贵记录
- 金篦作为妇女首饰:樊事真金篦刺目故事,保留了金篦为随身首饰的实物信息
- 腰带为身份符号:王玉带、王金带以腰带为艺名,反映腰带等级象征深入人心
- 腰截衣为贵重礼品:驸马丞相以马腰截赠歌妓,见腰截为元代贵重衣物
- 花旦化妆方式:李定奴条"以墨点破其面"为元代杂剧花旦角色的明确化妆记载
- 驾头为戏曲帝王冠服术语:出现3次(珠帘秀、顺时秀、南春宴条),为本书最常见的服饰术语
审核自检
| 检查项 | 结果 |
|---|---|
| 是否整本载入大TXT? | ❌ 未整本载入,先grep后sed分段读取 |
| 是否按词库搜索? | ✅ 三轮grep覆盖核心词+制度动作词+扩展词 |
| 每篇≤20KB? | ✅ 原文提取10KB,总结4.3KB |
| 是否据实撰写? | ✅ 无服饰内容处如实说明稀少,排除项逐一说明理由 |
| 对抗式审查 | ✅ 已排除比喻义、人名、乐器义等误命中 |
| 只处理本书? | ✅ 仅处理《青楼集》 |