《蟫精隽》服饰提取日志

基本信息

项目 内容
书名 蟫精隽
文件路径 /home/z/my-project/upload/part4/蟫精隽.txt
文件大小 189,543 字节
行数 1023 行
时代 明天顺—成化间
作者 徐伯龄,字延之,号古剡,嵊县人

执行步骤记录

Step 1:读取文件基本信息

Step 2:按词库执行多轮 grep

第1轮:核心服饰词全搜

执行命令: bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕' INPUT_FILE

命中行:3, 14, 31, 128, 233, 249, 251, 260, 262, 264, 281, 291, 296, 298, 326, 328, 348, 350, 352, 354, 356, 358, 360, 361, 393, 399, 421, 423, 453, 499, 501, 503, 505, 518, 523, 526, 538, 540, 541, 543, 545, 547, 564, 568, 570, 574, 576, 586, 590, 603, 605, 619, 626, 632, 634, 653, 655, 657, 676, 680, 682, 668, 706, 718, 726, 730, 738, 740, 766, 778, 782, 784, 800, 858, 909, 911, 917, 953, 955, 963, 988, 1013, 1017

共约80行命中

第2轮:制度动作词

执行命令: bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' INPUT_FILE

命中行: - 570: "赐绯"(骰子蒙恩亦赐绯) - 668: "赐紫金鱼带" - 3: "集箨为冠"(加冠语境) - 518: "冕而朝群臣"(朝服语境)

第3轮:首饰与配件扩展词

执行命令: bash rg -n '簪|钗|钏|步摇|花钿|胜|香囊|绡|纨' INPUT_FILE

补充命中:步摇(570行)、金钗(784行)、黄金钏(541行)、香囊(800行)、绡裳(348行)、轻绡(657行)

Step 3:审查排除

逐条审查所有命中,按排除规则表执行:

原始命中 排除原因 规则依据
高祖誓功衣带小 "衣带"为誓言比喻(山河带砺),非实指服饰 排除规则:比喻义排除
锦衣卫/锦衣千户/锦衣狱 "锦衣"为官署名(锦衣卫),非实指锦缎衣服 排除规则:官署名排除
天机云锦 书名 排除规则:书名排除
衣缨大家 "衣缨"代称士族门第 排除规则:代称义排除
冠古超今 "冠"为动词"超越"义 排除规则:动词义排除
两朝冠冕在斯文 "冠冕"为文坛领袖比喻 排除规则:比喻义排除
锦袍氏 水族拟人封号(鳜鱼) 排除规则:寓言拟人名排除
罗虬/罗昭谏/罗幼文 人名 排除规则:人名排除
锦带花 植物名 排除规则:植物名排除
玉簪花 花名 排除规则:花名排除
丝桐 指琴(丝弦+桐木) 排除规则:乐器代称排除
银丝省 "银丝"为鱼名封号拟人 排除规则:寓言拟人名排除
绣阁/绣谱 指房间/花样谱,非绣品实物 排除规则:非服饰语境排除
绣成堆 "绣成堆"为地名骊山华清宫 排除规则:地名排除
鲛绡丈余 神话织物,典故用法 排除规则:神话虚构排除
仙衣使者 鲎鱼的拟人封号 排除规则:寓言拟人名排除
马衣丞 海蚆的拟人封号 排除规则:寓言拟人名排除
衣绿绶佩玉玦 出自《夏清侯传》(竹拟人),"佩玉玦"为寓言修辞,"衣绿绶"保留 部分排除:佩玉玦排除,衣绿绶保留(有服制参考)

Step 4:提取上下文

因文件较大(1023行),对命中行逐一读取上下文,确认服饰语境。重点读取: - 264行(蒙衫专条)→ 确认为独立考据条目 - 325-326行(织屦专条)→ 确认为典故讨论 - 570行(唐宫词十首)→ 包含大量服饰信息 - 574行(叶广居诗)→ 含白苎衣裳、练巾葛屦 - 740行(东坡六忆诗)→ 含罗裙、纱裙、金钗等

Step 5:分类

有效服饰条目按以下类别整理: - 专条考据:2条 - 服制与赐服:5条 - 首服与头饰:7条 - 体服:8条 - 下服:5条 - 足服:6条 - 佩饰与首饰:7条 - 衣料与工艺:8条 - 妆容:5条

Step 6:创作三份MD

输出文件: - 蟫精隽_总结.md ✅ - 蟫精隽_日志.md ✅ - 蟫精隽_原文提取.md ✅

统计摘要

指标 数值
全书条目数 261条
grep命中行数 约80行
有效服饰条目数 32条
涉及关键词数 28个
专条考据 2条
制度性内容 5条
排除误命中数 17项