述衣

服饰古籍 · 全量通识

缘起

衣食住行,衣冠为首

衣食住行,衣冠为首,我一直想弄明白:历代传世典籍里,究竟留下了哪些关于古代服饰的文字记载?前人虽有不少研究,却始终没有一套全覆盖、大而全的系统性成果。

得益于智能技术突飞猛进,此次全量处理万部传世古籍,把书中所有关于古代衣冠、服饰形制、冠履配饰、纹样面料、历代礼制穿搭的内容,逐条提取整理,做成了易懂的简明总结提要。

把所有古籍彻底筛了一遍,找出哪些典籍服饰记载丰富、哪些内容偏少、哪些仅有寥寥数笔、哪些全书无一字提及。这份全量整理,经史子集、不做节选,覆盖正史别史、礼制通典、文人笔记、各地地方志、类书丛书,真正做到无一遗漏

往后无论是汉服同袍溯源考据,还是研究者做相关课题研究,都可以先看这份通识,把所有服饰相关史料,哪怕是藏在冷门古籍里的细枝末节,全都筛选提炼出来,可直接作为研究的基础和辅助。

通过不同古籍、不同作者的记载交叉印证,实证各类服饰形制在对应朝代的真实情况,让文史考据更严谨、更有依据。

古籍晦涩难懂,卷帙浩繁,一般人根本没有精力逐本翻查。现在不用啃原著,想查任意一部古籍有无服饰相关记载,看整理好的提要就能一目了然,希望我的工作能帮大家一定程度上解决了华夏衣冠古籍研究不好上手的难题。

怎么做到的

龙虾出征,万卷归宗

完成这件事,靠的不是人工逐本翻书摘抄,而是基于龙虾AI智能体,搭建了一套专用的古籍全自动处理系统。

我一口气部署起了十几只龙虾,并行分工跑任务。万部古籍体量太过庞大,只有多智能体同时运转,才有可能在一个多月内做完这项庞大工程。

写技能,做插件,编脚本,给每一只龙虾都设定了一套服饰考据规则与整理标准,让它们严格按我的思路,自动拆解、解读、提炼古籍文本。为了给这群龙虾配上足够强的"大脑",接入了多款国内顶尖大模型,统一接口调度,按各家模型特性分配不同任务环节,为此开通了各家平台最高规格月度算力套餐。总计用掉了上百亿的token。很费¥。

上万部古籍,文本体量极大,每本都要经过多轮递进式拆解与逻辑推理,对话链路极长。一个多月高强度满负荷运行,各家平台最高规格月度套餐的算力配额都被全部耗尽。这样的工作量,如果纯靠人力伏案逐书翻检,估计至少需要好几年才能完成。因为我试过,太难了放弃了。

不只是AI在跑

我也全程没松手

不是部署完龙虾就可以完全撒手不管、坐等成品。

1

部署调度——调度十几只龙虾并行运转,合理分配任务负载,确保万部古籍有条不紊地推进

2

紧盯运行——全程值守跟进运行状态,异常中断及时恢复,确保产出不丢不漏

3

逐批校验——逐批校验产出结果,内容不满意、标准不达标的,打回去重新迭代处理

4

整理建站——拿到合格整理文档后,二次规整梳理、优化内容结构,逐一做成网页、搭建整套展示网站

5

持续运维——后续还要长期维护更新,不断打磨完善

从调度、校验、返工、整理,到建站、运维,全程都投入了我大量时间精力和¥。光一个技能就迭代了上百个版本。

国产大模型实战

以华夏之器,考华夏之衣

这次特意全程只用了国产大模型,没有选国外模型。不是国外的不好用,而是我想把这次万部古籍的高强度实战,完全交给国产AI来历练沉淀。

这一个多月海量的古籍拆解与服饰考据过程,产生的大量真实交互场景与推理链,相当于为国产大模型在「古籍理解」与「传统服饰解析」这两个垂直领域,做了一次高密度、高质量的实战强化,留下了大量高质量的古籍服饰领域对话数据和校验标注样本。将来大家在使用这些国产模型去查询同类问题时,有更大概率缓存命中得到更懂古籍、更懂汉服文化的回应。

以现成龙虾智能体为调度基座,以国产大模型为核心引擎,再加上全程人工值守校验、迭代返工、整理建站与运维维护,这场耗时、耗力、耗算力的攻坚,既把散落在万部古籍里的华夏衣冠文脉系统梳理沉淀,也为国产AI深耕传统文化,留下了一份扎实的实战积累。

小米 MiMo 智谱 GLM DeepSeek Kimi 阿里通义 字节豆包 腾讯混元 MiniMax

诚邀指正

共同打磨,日趋完善

当然客观来讲,即便用上国内顶尖大模型全力运转,也没办法做到百分之百毫无遗漏。古籍异体字多、行文晦涩繁杂,难免有内容梳理不全或小有偏差。

大家在使用过程中,如果发现哪本文献有遗漏、整理不全、内容有出入的地方,欢迎随时指正。我可以调度模型,针对对应典籍重新复盘、重新跑一遍修正,慢慢把这套成果打磨得越来越完善。

三类文档

每部古籍均提供三种整理成果

📋

研究总结

对古籍中服饰相关内容的结构化研究与分析报告

📝

处理日志

文献处理过程中的标注、提取与整理记录

📜

原始文献

古籍原文全文,保留原始文本面貌

赞助支持

百亿token,只为一份华夏衣冠通识

万部古籍全量处理,前后花掉了上百亿token,各家平台最高规格月度算力套餐全部耗尽。每一条服饰条目的提取、校验、返工、再迭代,背后都是实打实的算力消耗。更不用说全程值守调度、技能上百次迭代、二次整理建站、持续运维打磨——时间精力与费用投入,远超预期。

如果你觉得这份整理成果对你的研究、考据、创作有帮助,欢迎赞助支持,让我能继续把更多古籍跑完、把已有成果打磨得更完善。"token"快烧不起了。

点此赞助