2025年2月14日,百度官方消息显示,百度将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。
百度之所以开源文心大模型,很大程度上都是因为DeepSeek带来了巨大的压力。DeepSeek技术实力强劲,其旗舰模型DeepSeek V3拥有6710亿参数,采用创新MoE架构,每秒可处理60个Token,在知识类任务、数学竞赛等表现突出。它还通过强化学习、知识蒸馏等技术提升性能。更重要的是,DeepSeek已开源,模型和技术论文公开,开发者能基于此创新,闭源模型的存在愈发尴尬。
值得注意的是,2024年4月,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上表示,“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以,开源模型会越来越落后。”不到一年时间,在DeepSeek的压力下,百度就一反此前的论调,开源最新的文心大模型,颇为讽刺。
0 条