《一得集》服饰内容提取 · 操作日志
时间:2026-04-19 任务:对医藏/一得集.txt执行服饰内容逐本整理 任务ID:batch1-1
操作流程
Step 1: 基本信息
wc -l /home/z/my-project/download/医藏/一得集.txt
→ 991行
mkdir -p /home/z/my-project/upload/1output/一得集
Step 2: 第一轮grep — 衣服类关键词
关键词:衣、裳、裘、冠、冕、弁、帻、巾、帽、履、舄、鞋、靴、袜、带、绶、佩、笏、袍、衫、袄、裙、裤、褐、襦、襟、袖、袂、领、衿、裾、幅、帷、幄、幔、帐、旌、旆、旗
命中行号(大量):15, 35, 59, 79, 87, 89, 115, 185, 199, 217, 283, 393, 417, 423, 489, 559, 577, 653, 675, 683, 747, 779, 821, 867, 891, 899, 957, 969, 985
初步判断:绝大多数命中为医学用语(更衣=如厕、药衣=丸剂包衣、带脉=经络),需逐条甄别。
Step 3: 第二轮grep — 纺织材料类关键词
关键词:丝、帛、绢、绸、缎、锦、绮、绫、罗、纱、绡、缟、缯、纺、绒、毡、褐、麻、葛、苎、绵、絮
命中行号:23, 35, 59, 73, 87, 103, 107, 109, 115, 245, 403, 425, 495, 505, 513, 543, 569, 605, 631, 653, 701, 779, 801, 847, 861, 875, 887, 889, 891, 929, 947, 957, 985, 987
甄别结果:
- “细如蛛丝""细软如丝"——脉象比喻
- “绸庄"——商号名称
- “锦轴"——书籍装帧
- “麻油""麻黄"——药材
- “绵延"——时间描述
- 唯一实质:第985行"芒鞋”
Step 4: 第三轮grep — 首饰/装饰类关键词
关键词:服、饰、妆、梳、簪、钗、钿、珰、环、钏、镯、珠、玉、翠、金、银
命中极多(数百处),但绝大多数为:
- 药材名(金银花、金汁、银花、珍珠、琥珀)
- 面色描述(面色、色变、色白、色赤)
- “不服其药""常服"——服药
- “装饰"不在原文中出现
Step 5: 第四轮grep — 颜色类关键词
关键词:染、色、赤、青、黄、白、黑、玄、紫、绯、绿、赭
命中极多,但均为医学望诊内容(面色、舌色、脉色),非服色制度。
Step 6: 第五轮grep — 纹饰/工艺类关键词
关键词:绣、织、纹、章、黼、黻、文、画
命中:7, 23, 35, 43, 45, 47, 59, 73, 79, 87, 101, 105, 109, 113, 115, 119, 127, 129, 137, 163, 171, 185, 191, 201, 209, 213, 235, 239, 245, 257, 265, 277, 283, 289, 295, 297, 299, 305, 307, 309, 311, 321, 323, 325, 329, 333, 335, 339, 341, 351, 359, 365, 371, 379, 385, 387, 391, 393, 395, 397, 403, 411, 415, 417, 419, 421, 423, 425, 427, 429, 435, 437, 439, 447, 449, 451, 459, 463, 467, 469, 471, 479, 483, 489, 495, 497, 499, 505, 507, 513, 521, 523, 525, 527, 529, 537, 543, 551, 557, 559, 569, 571, 575, 577, 585, 591, 599, 605, 607, 613…
几乎全部为"文"字命中("文明""文义""方文"等),无服饰纹饰内容。
Step 7: 第六轮grep — 制度性服饰关键词
关键词:冕服、冠服、朝服、祭服、丧服、常服、公服、法服、戎服、便服、凶服、龙袍、蟒袍、补服、道袍、僧衣、袈裟
结果:零命中("常服"命中2处,但均为"常常服用"之医学义,非常服制度)
Step 8: 第七轮grep — 僧人服饰专项
关键词:芒鞋、布衲、衲衣、禅衣、僧服、缁衣、祝发、削发、出家、方外、和尚、僧人
命中:
- 第985行:芒鞋、布衲(唯一实质服饰描写)
- 第209行:衲自祝发后(僧人自称+出家)
- 第983行:一朝祝发(出家)
- 第9行、23行、53行:和尚、僧心禅(身份称呼)
Step 9: sed提取关键行上下文
对第15、35、115、185、209、875、985等行提取前后3-5行上下文,确认各条实际含义。
Step 10: 分析与分类
将全部命中项分为三类:
- 实质服饰描写:仅1条(第985行芒鞋、布衲)
- 服饰词语的非服饰用法:14条(比喻、医学义、典故、书名等)
- 完全无关:数百条(药材、脉象、面色等)
Step 11: 撰写三份MD文档
- 一得集_总结.md:服饰结构化综述
- 一得集_日志.md:本文件,完整操作记录
- 一得集_原文提取.md:带行号的原始匹配片段
Step 12: 文件大小检查
ls -la /home/z/my-project/upload/1output/一得集/
审核结果
- 对抗式学术审查:所有引用原文均经grep+sed从源文件提取,行号可验证,无编造
- 内容极少的处理:如实说明该书服饰内容极少,未强行凑内容
- 非服饰用法的辨析:对"更衣""药衣""裘葛"等易混淆项逐一说明排除理由
关键发现
- 《一得集》为清代医案专书,作者为僧人心禅,全书无服饰制度记载
- 唯一服饰描写在书末题词中,以"芒鞋""布衲"描写僧人行医生活,属文学修辞
- “更衣"在医案中频繁出现,均为如厕义,非换衣义
- “为衣"指药丸包衣(如"越鞠丸用青黛为衣"),属中药术语
- “裘葛"以"十更裘葛"喻十年,为时间比喻
- 全书六轮grep+一轮专项搜索,确认服饰内容稀缺非遗漏