《右台仙馆笔记》服饰内容提取 · 日志
时间:2026-03-05 任务:提取《右台仙馆笔记》全部服饰相关内容
文件基本信息
- 文件路径:/home/z/my-project/upload/part1/右台仙馆笔记.txt
- 文件大小:700,806字节(701KB)
- 行数:1163行
- 性质:清·俞樾撰,笔记小说集
- 处理方式:grep+sed提取,未整本载入(大文件)
操作流程
Step 1:第1轮核心服饰词grep
bash
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|黼|黻|法服|燕服|翟衣|袆衣|深衣' 右台仙馆笔记.txt
命中:298行
Step 2:精准词grep(缩小范围)
bash
rg -n '幞头|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|补服|霞帔|首饰|簪|钗|步摇|花钿|蔽膝|屦|屐|缂丝|黼|黻|法服|翟衣|袆衣|深衣|弁|盔|胄' 右台仙馆笔记.txt
命中:14行
Step 3:逐条审查排除
因命中行数过多(298行),采取分层筛选策略: 1. 先用精准词定位高价值行 2. 再对核心词命中行逐条审查 3. 排除常见误命中(罗=人名/排列、带=带领、环=环绕、佩=钦佩等)
主要排除项: - "罗"字命中约40处,大多为人名(罗绍威等)或"罗致"等动词,仅2处为丝织品义 - "领"字大多为"领兵""领命",仅1处为衣领 - "冠"字大多为"冠军""冠绝",有效命中约5处 - "佩"字大多为"钦佩""佩之",有效0处
Step 4:有效命中统计
有效服饰相关行约25行,按主题分类: - 女性服饰/缠足:5条(第21/53/255/727/903行) - 鬼神服饰:4条(第145/591/727/741行) - 日常服饰:4条(第153/191/775/847行) - 婚俗丧葬:3条(第183/241/903行) - 纺织装饰:3条(第267/571/727行) - 宗教军事:2条(第375/895行) - 首饰:4条(第163/183/229/827行)
Step 5:关键发现
- 缠足工艺(第727行)为全书最详服饰描写:狐仙教缠足,以缣帛裹袜、白糖代矾
- 䄖裳考辨(第903行):俞樾注"今俗呼妇人上服曰褂,乃俗字也",引《释名》证"䄖"为本字
- 国丧与补服(第145行):阴间官吏不衣补服因国丧未除,反映清代服制意识
- 行缠侮辱(第255行):解妇人双行缠掷于通衢,反映缠足与女性尊严之密切关联
Step 6:审核结果
- 大文件处理合规,未整本载入 ✅
- 有效命中经grep+sed验证 ✅
- 排除误中项均记录 ✅