《生绡剪》服饰提取日志
基本信息
- 输入文件:/home/z/my-project/upload/part3/生绡剪.txt
- 文件大小:605,471 字节
- 总行数:1,525 行
- 输出目录:/home/z/my-project/upload/3小说output/生绡剪/
提取过程
第一轮:基础服饰词(衣、裳、袍、衫、裙、袄、褂、裘)
- 命中行数:约45行
- 主要发现:道袍(4处)、单袍、夹袄、红袄、直裰、麻衣、青布衫等
- 误命中:"衣冠人""衣袖"等非服饰专词,需过滤
第二轮:首服与首饰(冠、帽、巾、簪、钗、钏、环、珮、步摇)
- 命中行数:约18行
- 主要发现:三梁冠、绉纱四角唐巾、分心如意鸡鸭嘴巾、盔洗毡巾、金钏、翠翘、钗钏
- 误命中:"环佩之声""环顾"等非首饰义,已过滤
第三轮:足服与腰带(履、鞋、靴、带、绦、袜、舄)
- 命中行数:约22行
- 主要发现:大红方舄、麂皮靴、朱鞋凤嘴、陈桥鞋、尤墩袜、钉鞋、芒鞋、草绦、束腰带
- 误命中:"黄河如带"(比喻)、"鞋弓袜小"(有效)
第四轮:织物(绸、缎、绢、纱、绫、锦、布、帛、绡、褐、罗、葛)
- 命中行数:约38行
- 主要发现:月白丝绸、青绫、纻丝、棉绸、羊绒、潞绸、纱罗绫锦、绵绸、衲织纱罗、姑绒
- 弁语"兜罗氍毹""蕉葛草羽"为衣料比喻,有效
- "布贾"为回目人名,非衣物,已过滤
第五轮:珠宝首饰(珠、玉佩、金钗、银簪、首饰、戒指、耳环、项圈、金钏、玉带、金冠、银冠)
- 命中行数:约25行
- 主要发现:金钏犀杯、琥珀数珠、首饰一包、诗画金扇、金牌、南金、珠履、帽套四百金、簪挖丁香挑牙戒指
- 误命中:"米珠薪桂"(比喻)、"骊龙颔下珠"(典故),已过滤
第六轮:穿戴动作与装束(披、裹、束、佩、妆、打扮、装束、翠、凤冠、霞帔、嫁衣)
- 命中行数:约30行
- 主要发现:披领道袍、扮作道人、全真袍仗打扮、羽衣芒鞋、裙子拴腰、帕子包头、大红袄罩麻衣
- "披发"为发型描写非穿戴,部分过滤
审查与过滤
去除的伪服饰条目
| 条目 |
原因 |
| "黄河如带曲回回" |
比喻,非服饰 |
| "米珠薪桂" |
成语比喻 |
| "骊龙颔下珠" |
典故 |
| "布贾冤随布贾翻"(回目) |
"布贾"指布商,非衣物描写 |
| "锦添花"(回目) |
成语"锦上添花" |
| "环佩之声" |
泛指佩饰声响,非具体服饰 |
| "白衣秀才" |
指无功名者,非衣色描写 |
| "青衿闲守" |
"青衿"指秀才身份,虽与服制有关但此处为借代 |
| "绣口" |
比喻口才 |
保留但标注的边缘条目
| 条目 |
标注 |
| "兜罗氍毹""蕉葛草羽" |
弁语衣料比喻,有文献价值 |
| "青衿" |
虽为借代,但源自服制,保留 |
| "金带父亲" |
指知州品级,保留为官服制度旁证 |
| "象简绯袍拜玉皇" |
朝服制度描写,保留 |
最终统计
- 6轮搜索总命中行数:约178行(去重前)
- 去重后独立服饰条目:约58条
- 有效服饰描写涉及回数:15/19回
- 产出文件:
- 生绡剪_总结.md
- 生绡剪_日志.md
- 生绡剪_原文提取.md