《钦定词谱》服饰逐本整理日志
任务信息
- 任务名称:txt服饰逐本整理——《钦定词谱》
- 输入文件:
/home/z/my-project/upload/词集/词集/钦定词谱.txt - 输出目录:
/home/z/my-project/upload/词集output/钦定词谱/ - 文件规格:21519行,2.4MB
处理流程
第一步:文件探查
- 确认文件大小2.4MB、21519行,为超大文件
- 创建输出目录
第二步:关键词定位(grep)
- 初次grep以"衣裳冠带裙袖袍襟佩饰簪钗履靴帽绶环珮珰钿帔帼缨绫罗绸缎纱锦绣褐裘氅蓑笠舄"等30+字为pattern
- 命中2739行,数量庞大
- 缩小范围,以更具体的复合词组为pattern二次grep:
- 霓裳|羽衣|醉妆|绣衣|罗衣|绣凤凰|金钗|玉钗|裙带|绣带|罗裙|锦袖|花黄|罗幕|罗袜|锦帷|绣被|锦衾|朱衣|青裘|褐为裘|蓑衣|箬笠|绿袍|衮衣|霞裙|月帔|罗帏|红绶|香囊|缕金|翠钿|凤冠|宫妆|道服|莲花冠|胭脂
- 金缕|鲛绡|红裙|缃裙|纱窗|纱笼|翠袖|红袖|玉佩|珠翠|碧纱|金步摇|步摇|翠翘|玉步|弓鞋|弓弓|罗扇|纨扇|画罗|罗衫|衫儿|春衫|薄衫|单衣|衣裳|衣襟|衣薄|六铢衣|衮服|朝衣|宫衣
- 获取关键行号列表,标注高价值区间
第三步:关键片段截取(sed)
按服饰研究价值由高到低,依次提取以下区间原文:
| 序号 | 行号区间 | 词调名 | 服饰要点 |
|---|---|---|---|
| 1 | 186-190 | 醉妆词 | 宫人衣道服、簪莲花冠、施胭脂夹脸 |
| 2 | 200-212 | 南歌子 | 绣凤凰、罗衣绣凤凰、绣衣 |
| 3 | 258-270 | 回波词/舞马词 | 袍笏、衣以文绣络以金珠 |
| 4 | 284-290 | 柘枝引 | 帽施金铃 |
| 5 | 355-365 | 渔歌子 | 箬笠、蓑衣、褐为裘 |
| 6 | 474-490 | 长命女 | 窄衣裳、玉钗 |
| 7 | 533-570 | 采莲子等 | 红裙、金缕、朱衣、锦衾 |
| 8 | 635-710 | 甘州曲等 | 画罗裙、锦帷、花黄、绣带 |
| 9 | 726-760 | 法驾道引等 | 乌衣椎髻、金雀扇、罗幕、罗袜 |
| 10 | 829-875 | 诉衷情等 | 绿袍、金带枕宫锦、玉佩交带越罗 |
| 11 | 896-920 | 思帝乡等 | 衣裳、霞裙月帔、罗裙 |
| 12 | 1115-1125 | 思帝乡 | 六幅罗裙窣地 |
| 13 | 1156-1170 | 相见欢 | 罗袜绣袂 |
| 14 | 1195-1205 | 何满子 | 蓝罗裙子 |
| 15 | 1285-1302 | 醉太平等 | 薄罗衣窄、金泥缝、纨扇 |
| 16 | 1410-1460 | 酒泉子等 | 云鬟髻、罗带缕金、画罗襦 |
| 17 | 1670-1680 | 中兴乐 | 湿罗衣别名 |
| 18 | 1828-1845 | 中兴乐 | 泪湿罗衣、宫妆、裙带鸳鸯 |
| 19 | 1945-1955 | 恋情深 | 罗裙窣地缕黄金 |
| 20 | 1960-1975 | 浣溪沙 | 六铢衣薄、罗袜金菡萏 |
| 21 | 1985-2005 | 浣溪沙 | 红锦地衣、金钗溜、双蝶绣罗裙 |
| 22 | 2175-2210 | 好女儿/菩萨蛮 | 绣带儿、绣带双垂、丛头鞋子 |
| 23 | 2466-2478 | 好女儿 | 绣带儿别名 |
| 24 | 2501-2510 | 彩鸾归令 | 珠履、朱衣 |
| 25 | 3556-3570 | 阳台梦 | 薄罗衫子金泥缝、铢衣重 |
| 26 | 3755-3770 | 应天长 | 罗裙金线缕、翠翘玉步 |
| 27 | 6620-6645 | 柳梢青等 | 绣衣红袖、裙带住 |
| 28 | 6674-6695 | 拨棹子 | 罗衣蹙金绣、石榴裙带 |
| 29 | 8680-8695 | 荔枝香 | 金缕霞衣轻褪 |
| 30 | 8762-8775 | 婆罗门引 | 改婆罗门为霓裳羽衣 |
| 31 | 9330-9355 | 皂罗特髻 | 凤凰钗、纨扇、霓裳 |
| 32 | 9400-9420 | 最高楼 | 绣罗衣、缃裙罗袜薄衫 |
| 33 | 9485-9520 | 拂霓裳 | 罗幕、霞袖、红袖学飞琼 |
| 34 | 15105-15120 | 霓裳中序第一 | 罗衣初索 |
| 35 | 20763-20775 | 水调歌头 | 紧约罗裙、霓裳入破 |
| 36 | 21206-21360 | 调笑令群 | 冠缨玉钗、锦靴玉带、霞衣霓裳、罗裙红裙 |
| 37 | 21440-21519 | 薄媚大曲 | 越襟吴带、湘裙汉佩、霞衣、玉佩霞裙、衣霓裳 |
第四步:筛选与撰写
- 从37组截取片段中筛选最具服饰研究价值者,按类别归纳
- 撰写三份MD文件
注意事项
- 本文件为超大文件(2.4MB/21519行),全程使用grep+sed定位截取,未读取整个文件
- 服饰用词大量重复(如"罗衣""金钗"出现数十次),已去重归并
- 部分词句中服饰用语为文学修辞(如"六铢衣""霓裳"),已在总结中说明