《长物志》服饰提取日志

基本信息

项目 内容
书名 长物志
文件路径 /home/z/my-project/upload/part4/长物志.txt
文件大小 88,455 字节
行数 698 行(含空行)
时代 明(崇祯年间)
作者 文震亨(字启美,长洲人,武英殿中书舍人)
体裁 杂品类笔记,品鉴体

执行步骤记录

Step 1:读取文件基本信息

Step 2:按词库执行多轮 grep

第1轮:核心服饰词全搜

执行命令: bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|钗|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part4/长物志.txt

命中行:19,26,38,40,42,58,64,66,68,72,80,84,86,96,100,102,106,114,117,122,132,148,156,158,180,182,190,192,198,200,208,209,210,212,216,228,234,240,246,259,265,269,270,279,280,283,287,289,290,291,297,299,301,305,309,318,320,324,340,346,350,352,354,368,375,376,378,380,392,396,416,418,428,432,436,446,452,454,460,462,464,470,478,480,490,494,498,502,506,512,517,518,519,520,521,524,525,526,530,531,532,533,534,536,537,538,552,553,554,556,558,583,585,587,607,643,645,649,653,655,667,669

共约120行命中(含大量非服饰语境命中)

第2轮:制度动作词

执行命令: bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part4/长物志.txt

命中行:无

第3轮:组合扩展词

因第2轮零命中(本书为品鉴类而非制度类),补充搜索:

bash rg -n '蚕|桑|茧|缫|织|纺|缂丝|氆氇|琐哈剌|鹤氅|申衣|幅巾|铁冠|轻绡|茧绸|紫花|流苏|地衣|簪带' /home/z/my-project/upload/part4/长物志.txt

补充命中行:72,102,280,454,460,519,520,524,525,530,531,533,536,537,446

进一步精确搜索: bash rg -n '皂绫|白绫|金黄绫|绫条|皮条边|樗蒲锦|楼阁锦|凤皇锦|走龙锦|翻鸿锦|落花流水锦|宋叚|纻绢' /home/z/my-project/upload/part4/长物志.txt

补充命中行:287,291

Step 3:审查排除

逐条审查所有命中,按排除规则表执行:

原始命中 行号 排除原因 规则依据
绣补(堂帘花纹如绣补) 72 非补服制度,帘上装饰纹样 排除规则:非服饰义
罗纹笺 470 纸名,非丝织品罗 排除规则:非丝织品
罗纹(画梁椽) 72 建筑纹饰 排除规则:非丝织品
縚环结子(扇骨结构) 454 扇骨式样名,非腰带/佩饰 排除规则:非服饰义
冰裂鳝血纹/梅花片墨纹 464 瓷器纹样,非服饰纹 排除规则:非服饰语境
卧蚕纹(玉器纹样) 480 玉器雕纹,非服饰纹 排除规则:非服饰语境
纹(细钱纹手炉) 378 铜器纹样 排除规则:非服饰语境
领兵/领命 未出现
带领/地带/连带 未出现
钦佩/敬佩 未出现
环境等 未出现

Step 4:提取上下文

对有效命中行,分批执行 sed 提取上下文:

bash sed -n '515,560p' /home/z/my-project/upload/part4/长物志.txt # 衣饰门全章 sed -n '270,295p' /home/z/my-project/upload/part4/长物志.txt # 绢素/宋绣/裱锦 sed -n '372,382p' /home/z/my-project/upload/part4/长物志.txt # 袖炉/熏衣 sed -n '440,460p' /home/z/my-project/upload/part4/长物志.txt # 扇/扇坠/琴囊 sed -n '490,510p' /home/z/my-project/upload/part4/长物志.txt # 位置/卧室 sed -n '70,74p' /home/z/my-project/upload/part4/长物志.txt # 地衣/绢幔 sed -n '98,104p' /home/z/my-project/upload/part4/长物志.txt # 簪带

上下文完整,无截断。

Step 5:分类

有效服饰条目按以下类别整理: - 服饰制度与历代服制:1条 - 首服:4条 - 体服:2条 - 被褥帐幔:5条 - 足服:1条 - 服饰材料与织绣工艺:6条 - 服饰器用:3条 - 服饰观念与审美:1条

Step 6:创作三份MD

输出文件: - 长物志_总结.md ✅ - 长物志_日志.md ✅ - 长物志_原文提取.md ✅

统计摘要

指标 数值
全书规模 88KB/698行
第1轮grep命中行数 约120行
第2轮grep命中行数 0行
第3轮grep补充命中行数 15行
有效服饰条目数 20条
涉及关键词数 30余个
制度性内容 1条(历代服制总论)
排除误命中数 6项
内容等级 丰富(20条 > 16条阈值)