智源研究院:大模型时代下,跑出AI产业发展和深度应用“加速度”
【环球网科技报道 记者 郑湘琪】“人工智能在未来的几年之内会逐渐形成这样的状态:人工智能大模型作为基础的产业生态,用大算力训练出最高水平的智能,为各种人工智能应用‘赋智’。就像今天的电网给大家提供电力一样,未来几年,人工智能将以大模型为基础向社会提供源源不断的智力服务。”近日,在“三年而励·智源三周年特别活动”期间,智源研究院院长黄铁军这样表示。
近期,连创记录的悟道大模型已经迅速进入产业应用,无论是冬奥手语数字人,还是OPPO小布助手的“生成式回答系统”,都成为人工智能领域的“科研爆款”。而这一系列案例背后,正是基于智源研究院组建的悟道团队。
研发“悟道”大模型,建立产业生态
随着超大规模的预训练模型成为全球人工智能技术研发的热点,大模型有望引领未来数年之内的技术跃迁,并带来全新的产业模式。黄铁军表示,“人工智能的发展已经从‘大炼模型’逐步迈向了‘炼大模型’的阶段,业界通过设计先进的算法整合尽可能多的数据,汇聚大量算力,并集约化地训练大模型供大量企业使用,已是必然趋势。”
基于此,2020年10月,智源研究院开始对超大规模预训练模型“悟道”项目进行路径探索;今年3月,作为中国首个超大规模预训练模型,“悟道1.0”发布;6月,智源研究院发布“悟道2.0”。
与“悟道1.0”相比,悟道2.0在模型规模上实现爆发级增长,达到1.75万亿参数,打破了之前由国外预训练模型创造的1.6万亿参数记录。此外,悟道2.0还取得了多项世界级的创新突破,在预训练模型架构、微调算法、高效预训练框架方面实现了原始理论创新,并在多个国际人工智能基准测试榜单的9项任务上取得领先。
今年9月,“悟道”发布开放平台和高效推理工具包等,并在OPPO等企业合作中实现规模化应用,初步建立产业生态。目前,悟道大模型已在产业智能应用方面进入全面探索阶段。以最近发布的冬奥手语播报数字人系统为例,智源研究院副院长唐杰表示,“手语播报数字人依托‘悟道2.0’为底层核心技术研发,能够提供全流程智能化的手语生成服务。手语播报数字人将用于北京冬奥会期间赛事新闻的实时手语翻译播报,方便听障人士收看赛事报道。”
谈及“悟道”下一步的科研与生态建设规划,唐杰表示,“下个3年,智源研究院将以加强‘悟道’原始创新为核心,聚焦‘提智能’‘降门槛’‘建生态’。”
其中,在“提智能”方面,智源研究院将以原始技术创新为核心提升模型性能,通过模型持续学习、增加记忆机制、突破三元组知识表示方法等进一步提升万亿级规模模型的认知智能能力;在“降门槛”方面,围绕降成本、提速度和搭平台,让大模型用起来;在“建生态”方面,通过建立起悟道基金、悟道竞赛和悟道产业联盟三个方面推进。
优化研究布局,推动成果转化
据介绍,智源研究院已形成了“自由探索+目标导向”的研究布局。其中,在“自由探索”方面,智源研究院理事长张宏江表示,“我们以‘代表作’和‘小同行评价’遴选人才,支持青年人才‘挑大梁当主角’,希望帮助更多的年轻人送进‘名人堂’,而不只是借‘名人堂’来锦上添花。”
以“智源学者”计划为例,智源研究院坚持通过优中选优的小同行评议,遴选近100位代表人工智能领域国内顶尖水平的“智源学者”,支持他们进行自由探索。
此外,基于“目标导向”,智源研究院在信息模型、生命模型、智算平台和应用技术研究方向进行了布局。除了“悟道2.0”,智源研究院的另一个重大任务是生命模型“天演”,其目标是搭建世界运行效率最高、模拟级别最精细的高精度生命模型,为下一代人工智能背后的神经建构和机理研究提供支撑和启发。
“通过研发超大规模信息智能模型和生命模型,我们可以加速电子信息、生物医药等领域的科学研究进程,同时帮助创新企业及个人开发者构建智能化水平更高的场景应用,从而赋能实体经济智能化升级。”张宏江说。
为推动人工智能研究成果的产业化落地,智源研究院还成立十余个创新中心。智源研究院副院长曹岗表示,“智源创新中心针对科学家或创业团队的市场化工作,支持人工智能原始创新技术的开发、工程化验证和成果转化,通过专职工程技术人员,把原创性技术变成准产品,实现研究、应用的‘双轮驱动’。”
形成“智源模式”,创造更多科研“代表作”
据黄铁军介绍,2018年11月成立之初,智源研究院明确要聚焦原始创新和核心技术。三年来,智源研究院沿着人工智能技术的发展轨迹,将“炼大模型”,打造高精度生命模拟平台等作为技术路径,形成了独特的“智源模式”。
展望未来,黄铁军表示,“智源研究院将继续推进机制创新,一方面,吸引更多学者加入,创造出更多类似‘悟道’大模型的科研‘代表作’;另一方面,打造生态,连接技术与产业,推动人工智能产业发展和深度应用,改变人类社会生活,促进人类、环境和智能的可持续发展。”
黄铁军强调,未来3年,智源研究院的中心任务是超大规模智能模型训练技术、平台与应用示范。其中,模型包括“信息类的多模态认知模型”和“具身实时感知模型”。针对这两个模型,智源将开展研究支撑模拟所需的训练技术、核心技术、软硬件平台,以及背后开源开放的算法体系、标准体系、数据集、工程化测试验证和前沿理论。
版权作品,未经环球网 huanqiu.com 书面授权,严禁转载,违者将被追究法律责任。