《何氏语林》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 何氏语林 |
| 文件路径 | /home/z/my-project/upload/part1/何氏语林.txt |
| 文件大小 | 1,010,026字节(1MB大文件) |
| 处理日期 | 2026-03-05 |
搜索记录
第1轮:核心服饰词搜索
- 命令1:
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|帛|锦|绣|丝|麻|毡|帽|靴|鞋|袜|领|袖|袂|裾|衽|裆|裤|褶|襦|簪|钗|环' - 命中:575行(含大量非服饰语境)
- 命令2(更精准):
rg -n '冕|袍|裘|履|舄|笏|绶|幞头|裙|衫|褐|帛|锦|绣|毡|帽|靴|鞋|袜' - 命中:大量但超时,分片执行
第2轮:制度动作词搜索
- 命令:
rg -n '朝服|公服|赐服|赐紫|赐绯|章服|服色|品服|常服|戎服|祭服|丧服|法服' - 命中行:行111、223、332、564、971、997、1083、1150、1169、1742、1925、2006、2559等
第3轮:专项搜索
- 深衣/半臂/霞帔等:行1841、2184、2542、2889(半臂4条)
- 幅巾/纶巾/葛巾:行111、898、1150、2203
- 笏/绶/鱼袋/簪/钗/钏:行131、223、234、254、564、1083、1521、1642、1911、1988、2045、2750、2860
排除审查记录(主要误命中)
| 关键词 | 误命中场景 | 处理 |
|---|---|---|
| 衣 | "布衣"=平民身份(约30+处) | 保留但标注为身份义 |
| 服 | "服气""服食""服从" | 排除 |
| 带 | "带领""地带" | 排除 |
| 冠 | "冠军""冠绝" | 排除 |
| 领 | "领兵""领命" | 排除 |
| 环 | "环能""环境" | 排除 |
| 纹 | "纹饰"可能非服饰 | 视语境 |
| 丝 | "丝竹"=音乐 | 排除 |
| 麻 | "麻制"=诏书 | 排除 |
保留条目统计
| 类别 | 条目数 | 主要内容 |
|---|---|---|
| 首服 | 8 | 幅巾、纶巾、葛巾、大冠、黄冠、小冠、文冕、帽 |
| 体服 | 15+ | 朝服、戎服、半臂、绛衣、紫罗襦、鹤氅裘、布衣、短褐、裘、红裈、袴、缬袍、衫帽、衩衣 |
| 足服 | 5 | 屐、蛮靴、芒屩、弊履、革履 |
| 佩饰 | 10+ | 笏(含笏囊)、绶、腕钏/跳脱、花钿、玉簪、璎珞、金钏 |
| 礼服制度 | 7 | 赐服/章服、赐绯、祭服、朝服制度、戎服庭趋、服色搭配 |
| 衣料工艺 | 6 | 绣罗帐、纱縠、绮缟、缬、素绢、罗绮 |
提取方式
- 1MB大文件,严禁整本载入
- 全程使用rg -n定位 + sed -n分片提取
- 三轮grep逐步缩小范围
- 对关键行使用sed提取上下文验证