《酒经》服饰内容整理——操作日志
一、基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 酒经(北山酒经) |
| 作者 | 宋·朱肱 |
| 输入路径 | /home/z/my-project/upload/饮馔/饮馔/酒经.txt |
| 输出路径 | /home/z/my-project/upload/饮馔output/酒经/ |
| 文件总行数 | 80行 |
| 文件大小 | 34,625字节(约34KB) |
二、操作记录
第1步:文件基本信息
wc -l结果:80行wc -c结果:34,625字节- 判定:文件体量小,可直接逐行grep,无需分块
第2步:六轮grep筛查
第一轮:核心服饰词(衣、裳、服、冠、帽、巾、履、鞋、靴、袜、带、佩、裘、袍、衫、裙、裤、褐、襦、袄、襟、裾、袂、衿、领、袖)
- 匹配行:6, 8, 10, 12, 14, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78
- 初筛结果:大量匹配,但绝大多数为非服饰用法(酿酒术语中的"衣"、"布"等)
- 有效条目:牛衣(行6)、攘襟(行6)、缙绅(行6)
第二轮:冠服制度词(冕、弁、帻、幞头、簪、笄、步摇、凤冠、进贤冠、乌纱、貂蝉)
- 匹配行:无
- 结论:全书无冠服制度词
第三轮:织物材料词(丝、帛、绢、绸、缎、绫、罗、锦、绮、纱、布、麻、葛、棉、裘、褐)
- 匹配行:6, 8, 10, 12, 14, 18, 20, 22, 24, 26, 28, 30, 34, 42, 46, 58, 64, 76, 78
- 初筛结果:绢袋、布(覆盖用)、麻皮、毡毯、绵等均为工具器物用途
- 有效条目:毡毯(行6)——经审核为包裹酒瓮保温用,排除
第四轮:颜色纹饰词(紫、绯、绿、青、赤、黄、白、黑、玄、黼、黻、龙、凤、绣、织、染)
- 匹配行:6, 8, 10, 12, 14, 18, 20, 22, 24, 26, 28, 42, 52, 56
- 初筛结果:所有颜色词均为食材、药料、酿酒反应色,非服色
- 有效条目:无
第五轮:配饰器物词(玉、佩、环、珮、鱼袋、笏、带钩、鞶囊、扇、伞、盖)
- 匹配行:6, 8, 10, 12, 14, 18, 20, 22, 24, 26, 28, 30, 36, 42, 44, 46, 50, 54, 56, 58, 62, 64, 66
- 初筛结果:"玉友麴"为麴名;"盖"均为覆盖义;"佩"无匹配
- 有效条目:无
第六轮:动作制度词(赐服、赐紫、赐绯、借紫、加冠、冠礼、服色、服制、禁服、僭服)
- 匹配行:无
- 结论:全书无冠服制度动作词
第3步:补充验证grep
grep -n '牛衣\|攘襟\|缙绅\|衣发\|襟露\|露腹':确认行6三条有效条目grep -n '绅\|袍\|裙\|冠\|巾\|履\|帻\|簪\|笄\|褐\|襦':仅行6"缙绅",无新增grep -n '毡\|毯\|绵\|绸\|缎\|绫\|罗\|锦\|绮':行6"毡毯"、行64"新绵",均为工具用途
第4步:去重合并
- 六轮grep总匹配行:几乎覆盖全书
- 经逐一审核去噪音,有效服饰条目仅3条,全部集中在行6
三、关键发现
- 服饰内容极度匮乏:全书80行、约34KB文本中,仅3条与服饰相关,且均为修辞引典,无实际服饰记载
- 伪服饰词大量存在:酿酒术语借用服饰词("衣"指菌丝覆层、"布"指覆盖工具、"绢袋"指过滤工具等),造成grep噪音极高
- 有效条目集中于卷首:唯一涉及服饰的行6为全书总论部分,属于文学性表述,非技术性记载
- 与文献性质完全吻合:酿酒技术手册不以服饰为叙事对象,此结果属正常预期
四、踩坑记录
| 坑点 | 说明 | 处理方式 |
|---|---|---|
| "衣"字噪音极大 | "花衣""白衣""浆衣""以……为衣"均为酿酒术语 | 逐条审核,区分隐喻用法与实际衣物 |
| 颜色词全部伪匹配 | 赤、青、黄、白、黑均出自食材药料名或发酵反应色 | 全部排除 |
| "毡毯"边界模糊 | 包裹酒瓮的毡毯是否算服饰? | 严格定义:非人穿着之物不算服饰,排除 |
| "缙绅"是否归入 | 已完全身份化的词语是否算服饰? | 列为"服饰衍生社会身份类",注明边界 |
五、审核结果
- 有效服饰条目数:3条
- 伪服饰词排除数:10+条
- 文献服饰信息密度:极低(3条/80行 = 3.75%行涉及,实际信息量接近零)
- 审核结论:据实记录,不灌水、不硬套模板