《东海渔歌》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 东海渔歌 |
| 作者 | 清·顾春(太清) |
| 输入文件 | /home/z/my-project/upload/剧曲/剧曲/东海渔歌.txt |
| 输出目录 | /home/z/my-project/upload/剧曲output/东海渔歌/ |
| 全书行数 | 1246行 |
| 文件编码 | UTF-8 |
处理流程
第一步:统计行数
wc -l 东海渔歌.txt
# 结果:1246行
第二步:多轮grep提取
使用ripgrep(rg)对47个服饰关键词逐一搜索,分两批执行:
第一批(28个):衣、裳、冠、带、袍、裘、褐、巾、履、屦、绅、袂、裾、襟、裙、幅、弁、冕、簪、珥、佩、环、绮、罗、纱、绢、帛、锦、绣、练、絮、布、麻、丝、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旗、旌、旆、纛
第二批(11个无匹配/补充验证):褐、绅、弁、冕、珥、黼、黻、鹖、帻、旆、纛
第三步:匹配结果统计
| 关键词 | 匹配行数 | 服饰义行数 | 说明 |
|---|---|---|---|
| 衣 | 26行 | ~18行 | 含"红衣"(荷花)、"毛衣"(鸟羽)、"乌衣"(燕子)等非服饰义用法 |
| 裳 | 8行 | 7行 | "霓裳"6处+"衣裳"2处,几乎均为服饰义 |
| 冠 | 5行 | 4行 | "道家冠""衣冠"2处"冠玉""自冠群" |
| 带 | 15行 | 4行 | 大量为"一带""带领""携带"等非服饰义 |
| 袍 | 0行 | 0行 | 无匹配 |
| 裘 | 4行 | 4行 | "翠云裘""貂裘""羊裘"2处,均为服饰义 |
| 褐 | 0行 | 0行 | 无匹配 |
| 巾 | 2行 | 1行 | "泪沾巾"1处为服饰义;另1处"巾"在附录引文 |
| 履 | 3行 | 1行 | "珠履"1处为服饰义;2行为校勘注 |
| 屦 | 1行 | 1行 | "黄公屦"为服饰义 |
| 绅 | 0行 | 0行 | 无匹配 |
| 袂 | 5行 | 4行 | "罗袂"2处+"缟袂"1处+"判袂"1处(离别义)+"把袂"1处 |
| 裾 | 5行 | 4行 | "霞裾"2处+"衣裾"1处+"仙裾"1处;1处为校勘注 |
| 襟 | 17行 | ~10行 | 含"胸襟"(非服饰义)、"襟袖"(服饰义)等多种用法 |
| 裙 | 1行 | 1行 | "裙钗"1处 |
| 幅 | 7行 | 0行 | 均为"画幅""一幅"等量词用法,无服饰义 |
| 弁 | 0行 | 0行 | 无匹配 |
| 冕 | 0行 | 0行 | 无匹配 |
| 簪 | 6行 | 5行 | "玉簪"2处+"簪花"3处 |
| 珥 | 0行 | 0行 | 无匹配 |
| 佩 | 16行 | 5行 | 大量为人名(湘佩、佩吉等),仅"双獾佩""玉佩""佩环""风裳水佩"为服饰义 |
| 环 | 12行 | 3行 | "佩环""玉连环"等;大量为"环抱""湾环"等非服饰义 |
| 绮 | 5行 | 3行 | "绮筵""罗绮""绮窗" |
| 罗 | 22行 | ~15行 | "罗衣""罗袂""罗衫""罗袜""罗衾""罗纨"等 |
| 纱 | 14行 | ~6行 | "纱窗""碧纱窗""暗窗纱""纱帷"等 |
| 绢 | 0行 | 0行 | 无匹配 |
| 帛 | 2行 | 2行 | "五色帛""剪帛"均为织物义 |
| 锦 | 13行 | ~7行 | "锦字""蜀锦""锦帐""锦堂"等 |
| 绣 | 16行 | ~10行 | "绣箔""绣帘""绣被""绣罗襦""绣户"等 |
| 练 | 4行 | 1行 | "练囊"1处为织物义;"如练"3处喻水非服饰 |
| 絮 | 12行 | 2行 | "轻絮""弱絮"2处可关联服饰材质;余为柳絮飞絮 |
| 布 | 2行 | 1行 | "布袜"1处为服饰义;1处为"布"在附录引文 |
| 麻 | 1行 | 1行 | "麻衣"为丧服 |
| 丝 | 35行 | ~5行 | 大量为"丝雨""情丝""丝竹"等非服饰义;仅"冰丝""丝线"等关联织物 |
| 绸 | 1行 | 0行 | "绸缪"为情意义,非织物义 |
| 缎 | 0行 | 0行 | 无匹配 |
| 缯 | 0行 | 0行 | 无匹配 |
| 绫 | 1行 | 1行 | "吴绫"为织物义 |
| 纨 | 3行 | 3行 | "纨素""罗纨扇""罗纨"均为织物义 |
| 绡 | 9行 | 8行 | "冰绡""鲛绡""生绡""薄绡衣"等 |
| 绶 | 2行 | 2行 | "绿绶""紫绶"均为品级服饰义 |
| 绂 | 1行 | 0行 | "潘绂庭"为人名 |
| 黼 | 0行 | 0行 | 无匹配 |
| 黻 | 0行 | 0行 | 无匹配 |
| 鹖 | 0行 | 0行 | 无匹配 |
| 帻 | 0行 | 0行 | 无匹配 |
| 帷 | 4行 | 3行 | "朱帷""纱帷""风帷"为帷帐义;1处为附录 |
| 帐 | 3行 | 3行 | "斗帐""锦帐""甲帐"均为帷帐义 |
| 幄 | 1行 | 1行 | "高槐如幄"为帷帐比喻义 |
| 旗 | 3行 | 2行 | "灵旗""旌旗"为旗帜义 |
| 旌 | 4行 | 3行 | "霓旌翠盖""霓旌霞葆""帘旌" |
| 旆 | 0行 | 0行 | 无匹配 |
| 纛 | 0行 | 0行 | 无匹配 |
第四步:噪音过滤规则
以下情况标记为"非服饰义"并从总结中排除:
- 量词用法:幅(一幅新图、横幅)
- 人名含关键词:湘佩、佩吉、潘绂庭
- 植物/自然比喻:红衣(荷花瓣)、毛衣(鸟羽)、苔衣(苔藓)、乌衣(燕子)、如练(江水)
- 抽象引申义:胸襟、绸缪、丝雨、情丝、一带、带领、环抱
- 校勘注:【校】标记行仅保留与服饰直接相关的校改
第五步:输出文件
| 文件 | 大小 | 说明 |
|---|---|---|
| 东海渔歌_总结.md | ≤20KB | 服饰内容分类概述与特征分析 |
| 东海渔歌_原文提取.md | ≤20KB | 含服饰关键词的原文逐条摘录 |
| 东海渔歌_日志.md | ≤20KB | 本文件,处理流程与统计记录 |
命中关键词汇总
- 有匹配的关键词:30个(衣、裳、冠、带、裘、巾、履、屦、袂、裾、襟、裙、簪、佩、环、绮、罗、纱、帛、锦、绣、练、絮、布、麻、丝、绫、纨、绡、绶、帷、帐、幄、旗、旌)
- 其中具有服饰义的:衣、裳、冠、带(少量)、裘、巾、履、屦、袂、裾、襟、裙、簪、佩(少量)、环(少量)、绮、罗、纱、帛、锦、绣、练(少量)、絮(少量)、布、麻、绫、纨、绡、绶、帷、帐、幄、旗、旌
- 无匹配的关键词:15个(袍、褐、绅、弁、冕、珥、绢、缎、缯、黼、黻、鹖、帻、旆、纛)
- 有匹配但无服饰义:3个(幅、绸、绂)
关键发现
- 全书服饰描写以仙道意象为主导(羽衣、霓裳、缟袂、霞裾),与词人贵族身份及慕仙情怀一致
- 轻薄丝织品(罗、绡、纨)远多于厚重织物,契合婉约词风
- 附录史料中关于顾太清"好著白衣""披红斗篷""内家妆束"的记载,为研究清代宗室女性日常着装提供了珍贵一手资料
- 全书无袍、褐、弁、冕、黼、黻等朝服祭服关键词,反映词人虽为贝勒侧室,但词作不以朝堂仪典为主题
- 旗帜类(旗、旌)仅出现在仙界仪仗描写中(霓旌翠盖、灵旗),无现实军事场景