AI for Science论坛第2期 | 协作生成式人工智能(Co-GenAI):一种融合驱动的新型框架

发布时间:2025-12-03 【   】

报告题目:协作生成式人工智能(Co-GenAI):一种融合驱动的新型框架

摘要:我们提出了一种全新的框架,使基础模型的开发更加高效、易用且具协作性。其核心是领域自适应持续预训练(Domain-Adaptive Continual Pretraining, DACP),该方法将轻量化高效性(通过首个端到端FP8低比特训练套件实现)与协作式专业能力相结合,将专家直觉嵌入到领域特定模型中。DACP能够利用无标注的领域数据持续适配大型语言模型,在医疗、科学等代表性不足的领域中实现更优的专化效果,同时显著降低GPU成本并超越主流系统性能。该框架还包含一个高级模型融合模块(Advanced Model Fusion),可跨不同预训练架构整合各领域顶级模型,仅需约160 GPU小时便可构建强大的基础模型,而从零训练通常需要上百万GPU小时。其资源高效架构(Resource-Efficient Architecture)进一步实现了AI的普惠化,使分布式、入门级GPU集群也能高效运行,从而减少对集中式算力的依赖。此外,我们首次建立了模型融合的理论尺度定律(scaling law),为分布式生成式人工智能提供了新的理论基础。真实世界的应用验证了该框架的强大影响力:医学模型性能超越了谷歌的MedGemma,多智能体系统的表现可与OpenAI的Deep Research相媲美。 该框架重新定义了基础模型的研发方式——让AI的构建更快、更低成本、更具包容性。

报告时间:2025年12月19日

嘉宾介绍:杨红霞教授现任香港理工大学(PolyU)计算与数理学院副院长、理大人工智能学院(PolyU Academy for AI,PAAI)执行院长及教授。她于美国杜克大学(Duke University)获得博士学位,已在国际顶级会议与期刊发表超过150篇论文,并拥有50余项专利。她曾获多项国际与国家级荣誉,包括:2019年世界人工智能大会(WAIC)最高奖——超级AI领袖(SAIL)奖、2020年国家科学技术进步奖二等奖、2021年中国电子学会科学技术进步奖一等奖,以及2022年福布斯中国科技女性50强与教育部科学技术进步奖一等奖。自2023年起,她连续入选AI 2000全球最具影响力学者,并于2025年被评为全球AI领域最具影响力的50位女性之一(CoinDesk评选)及WAIC SAIL年度三十强项目获奖者。杨教授的职业生涯横跨学术界与产业界,曾在多家世界顶尖科技公司担任领导职务:包括字节跳动美国LLM负责人、阿里巴巴集团AI科学家兼总监、雅虎公司首席数据科学家,以及IBM T.J. Watson研究中心研究员。她还曾担任浙江大学与中科院上海高等研究院的兼职教授。值得一提的是,她先后创立了阿里巴巴与字节跳动的基础模型团队,是生成式人工智能(Generative AI)领域的开创者与先行者之一。




附件下载: