《金台答问录》服饰内容提取 · 工作日志
任务ID:batch1-5 时间:2026-04-20 操作者:rysxguji 子Agent
Step 1:文件基本信息
| 项目 | 值 |
|---|---|
| 文件路径 | /home/z/my-project/upload/part4/金台答问录.txt |
| 文件大小 | 62,101 字节 |
| 行数 | 134 行 |
| 作者 | (明)湛若水 撰 |
| 性质 | 明代心学语录 + 附录明史列传 |
Step 2:三轮grep检索
第1轮:核心服饰词(全搜)
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|钗|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣'
命中行:13, 16, 18, 20, 58, 72, 75, 78, 79, 80, 86, 100, 101, 105, 106, 107, 108, 110, 111, 112, 113, 115, 116, 117, 118, 119, 120, 122, 123, 124, 125, 126, 127, 128, 130, 132, 133, 134
大量命中为误命中(单字"色""常""朝""法""吉""祭""章""公""首""头"等在非服饰语境中频繁出现)
第2轮:制度动作词
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠'
命中:0行(无一制度动作词命中)
第3轮:组合扩展词
按需搜索蚕|桑|茧|缫|织|纺|银帛|金帛|貂|裘等,补充命中:
- 第75行:银帛(赐百官银帛)
- 第86行:金帛(也先索金帛)
- 第100行:貂(衰服袭貂)
Step 3:逐条审查与排除
共审查首轮命中约38行,逐条排除结果如下:
| 行号 | 命中关键词 | 审查结果 | 排除理由 |
|---|---|---|---|
| 13 | 辔 | 排除 | "联辔道中"=骑马同行,辔为马缰 |
| 16 | 罗、色、花 | 排除 | "罗达夫"人名;"色"=形色;"花实"=花果 |
| 18 | 罗 | 排除 | "罗达夫"人名 |
| 20 | 领、公 | 排除 | "领受"=动词接受;"公"非公服义 |
| 58 | 罗、常 | 排除 | "罗达夫"人名;"常常"=副词 |
| 72 | 赐×3 | 排除 | "赐第""赐祭"等,赐宅第/祭祀,非赐服 |
| 75 | 帛、赐×3 | 保留帛 | "银帛"=丝帛赏赐物 |
| 78 | 服×多、法驾、赐×2 | 排除 | "臣服"=服从;"法驾"=车驾仪仗;"赐祭"=赐予祭祀 |
| 79 | 赐×2 | 排除 | "复官赐祭"=赐祭祀 |
| 80 | 赐×3 | 排除 | "赐今名"=赐名 |
| 86 | 帛 | 保留 | "金帛"=金银丝帛,外交语境 |
| 100 | 衣×2、锦衣、服×多、貂 | 保留衰服+袭貂 | "衰服袭貂"=丧服违制实例 |
| 105 | 衣×3、冠、锦衣 | 排除 | "锦衣指挥"=官职;"宠冠"=动词 |
| 117 | 赐×3 | 排除 | 赐月廪白金楮币=赐薪俸纸币 |
| 130 | 服×多 | 排除 | "服除"=丧期满,间接但不涉及服饰本身描写 |
| 132 | 笏 | 保留 | "举笏谢"=朝堂执笏行礼 |
最终保留4条:衰服袭貂、赐百官银帛、金帛、举笏谢
Step 4-5:上下文提取与分类
已完成,详见总结.md与原文提取.md。
关键踩坑记录
- 单字误命中极多:此书为哲学语录+史传,"服""赐""章""法""吉""朝"等字在非服饰语境中高频出现,首轮命中38行中仅4条经审查后保留
- "锦衣"陷阱:两处"锦衣"均指锦衣卫官职,非服饰描写
- "冠"陷阱:唯一次出现在"宠冠后宫"中,为动词"居首"
- 附录非正文:所有服饰信息均出自附录明史列传,非《金台答问录》正文
- "法驾"边界:法驾属车舆仪仗,严格来说非服章,已排除
审核结果
全部通过 ✅ — 原文均从TXT文件grep提取,有明确行号对应,排除规则严格执行。