《谭苑醍醐》服饰提取日志篇
提取时间:2026-03-04
操作者:AI子Agent
输入文件:/home/z/my-project/upload/part4/谭菀醍醐.txt
输出目录:/home/z/my-project/upload/4笔记output/谭菀醍醐/
词库版本:fushi-keywords.md(rysxguji技能内置)
一、文件基本信息
| 项目 | 数值 |
|---|---|
| 文件名 | 谭菀醍醐.txt |
| 总行数 | 800行 |
| 文件大小 | 143,520字节(约140KB) |
| 书名 | 谭苑醍醐 |
| 作者 | 明·杨慎 |
| 卷数 | 九卷 |
| 分类 | 四库全书·子部·杂家类·杂考之属 |
| 文本来源 | 四库全书本 |
二、提取策略
2.1 安全策略
- 文件140KB,未超过500KB阈值,但因笔记体单条较长(最长单行可达数百字),仍采用grep定位+sed提取的策略
- 未一次性载入全文,分批读取关键段落
2.2 搜索轮次记录
第1轮:核心服饰词全搜
搜索命令:
bash
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣'
命中行数:约42行(含大量误命中)
第2轮:制度动作词全搜
搜索命令:
bash
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠'
命中行数:2行(其中1行为新发现,1行与第1轮重叠)
第3轮:组合扩展词按需搜索
搜索命令:
bash
rg -n '蚕|桑|茧|缫|织|纺|缂丝|折帛|和买|市舶|绢价|匹帛|蟒衣|飞鱼服|斗牛服|麒麟服|软脚|硬脚|展角|交角|乌纱|大裘而冕|衮冕|赐鱼袋|佩鱼|金银鱼袋'
命中行数:4行(其中2行为新发现:八蚕之绵、茧糖)
三、逐条审查记录
3.1 排除审查(按排除规则表)
| 行号 | 关键词 | 误命中场景 | 处理 |
|---|---|---|---|
| 3 | 衣 | "衣"在四库提要中无服饰语境 | 排除 |
| 24 | 履 | "履狶"=踩猪(庄子典故) | 排除——动词义非足服 |
| 35 | 履 | 同上,监市履狶注 | 排除 |
| 46 | 带 | "地带""连带"=方位义 | 排除 |
| 49 | 紫 | "紫微宫"=星象/官署名 | 排除 |
| 104 | 矢/金 | "金矢"=诉讼制度,非佩饰 | 排除 |
| 248 | 带 | "带河"=河山之险 | 排除 |
| 254 | 朱/紫 | "朱门""紫闼"=官第代称 | 排除 |
| 282 | 锦 | "锦花浮"=水纹比喻 | 排除 |
| 324 | 绣 | "绣出花枝"=比喻 | 排除 |
| 328 | 弁 | "侧弁起舞"=比喻醉态 | 排除 |
| 342 | 衣 | "曝衣于日中"=晾衣,但为蒸发论证之例 | 排除——非服饰语境 |
| 355 | 丝 | "丝不如竹"=音乐术语 | 排除 |
| 360 | 绮 | "绮艳"=诗风评价 | 排除 |
| 537 | 绮 | "绮语"=佛教术语 | 排除 |
| 627 | 茧 | "茧糖"=食物名 | 排除 |
| 709 | 裳 | "棠字古作裳"=文字学,裳为借字 | 排除——非服饰语境 |
| 781 | 紫 | "紫盖"=祥瑞旗盖 | 排除 |
| 784 | 缨 | "缨寂相继"=官宦世袭 | 排除——代指义 |
3.2 保留审查(含边缘判断)
| 行号 | 关键词 | 语境 | 保留理由 |
|---|---|---|---|
| 85 | 佩玉 | 诗"佩玉琼琚"论贵族女性装饰 | 佩玉为佩饰本体 |
| 181 | 朱衣/素带 | 成公绥《钱神论》述官员服饰 | 服色制度史料 |
| 189 | 罗袜/履/靴/鞋 | 弓足专考,足服谱系 | 足服专题 |
| 191 | 罗襦 | "罗襦襟解微闻香泽" | 体服+香文化 |
| 193 | 罗绮/薰服 | 宫人服饰描述 | 体服 |
| 205 | 席帽/帷帽/巾帼/胡帽/锦帕 | 羃䍦考,首服演变 | 首服专题 |
| 207 | 舄/履/絇/鞮鞻/靴/鞋 | 履考,足服谱系 | 足服专题 |
| 219 | 簦笠/葛越/布/白越 | 草布/衣料考证 | 衣料专题 |
| 240 | 绢 | "古绢字"——仅1句 | 保留但标注为极简条 |
| 242 | 鞍/瓖 | 马饰+妇饰 | 佩饰+马具 |
| 260 | 衣襦 | "遍体无衣襦"=描述野女无衣 | 边缘——但"衣襦"为服饰词 |
| 344 | 蚕/茧/绵 | 八蚕之绵,蚕桑制度 | 蚕桑纺织 |
| 393 | 韡/靴 | "联墙之履曰韡今俗作靴" | 足服字源考 |
| 435 | 弁/帻/巾帼/步揺/簂 | 巾帼专考 | 首服专题 |
| 439 | 尚衣 | 官名考证 | 服饰制度 |
| 441 | 尚衣 | 同上 | 服饰制度 |
| 575 | 衣缨 | "不欲衣缨拂之" | 体服细节 |
| 607 | 金翠/足跗 | 妓女足饰 | 佩饰 |
| 609 | 绸缪/襳𧛹 | 妇人长带术语 | 腰带专题 |
| 611 | 裳/履 | "褰裳""脱履"——婚礼行为 | 服饰礼仪 |
| 617 | 衣服 | "武灵王衣服之赐" | 服饰制度(赐服) |
| 629 | 纺绩 | "照纺绩则暗"——鱼膏灯 | 边缘——纺绩为背景非主体 |
| 701 | 芒屩/帷帽 | 画像服饰考辨 | 首服+足服 |
| 704 | 十眉图 | 唐代眉妆十种 | 边缘——妆容非服饰,但与女性装饰相关 |
3.3 最终入选条目(12条核心+3条边缘)
核心条目(12条): 1. 佩玉琼琚/洵美且都(L85) 2. 朱衣素带(L181) 3. 弓足(L188-189) 4. 香泽(L190-191) 5. 薰服泽燕(L192-193) 6. 羃䍦考(L204-205) 7. 履考(L206-207) 8. 薛越草布(L219) 9. 八蚕之绵(L344) 10. 巾帼(L434-435) 11. 绸缪襳𧛹(L608-609) 12. 戏妇(L610-611)
辅助条目(3条): 13. 錽/瓖·马饰妇饰(L242) 14. 尚衣(L439/441) 15. 张僧繇画失考(L701)
边缘但记录(2条): 16. 武灵王衣服之赐(L617)——仅一句话提及 17. 翠足粉胷(L606-607)——简短
四、遗漏风险自评
| 风险项 | 评估 | 说明 |
|---|---|---|
| 组合词遗漏 | 低 | 第3轮已搜蚕桑纺织类,命中有限 |
| 同义词遗漏 | 中 | 如"袆衣""翟衣""深衣"等礼服词未命中,本书可能无相关内容 |
| 语境误判 | 低 | 已逐条审查排除规则表中的典型误命中场景 |
| 断章取义 | 低 | 每条均提取完整段落上下文,笔记体单条独立性强 |
| 编码问题 | 无 | 文本无乱码,仅有少量罕见字显示为替代字符 |
五、操作时间线
| 步骤 | 耗时 | 操作 |
|---|---|---|
| 1. 文件信息检查 | - | wc -l/wc -c 确认800行/140KB |
| 2. 目录创建 | - | mkdir -p 输出目录 |
| 3. 第1轮grep | - | 核心服饰词全搜,命中约42行 |
| 4. 第2轮grep | - | 制度动作词,命中2行 |
| 5. 第3轮grep | - | 组合扩展词,命中4行 |
| 6. 逐行审查 | - | 排除19条误命中,保留17条 |
| 7. 上下文提取 | - | 分8批sed读取关键段落 |
| 8. 撰写三份MD | - | 总结篇/日志篇/原文提取篇 |