退出“超大基模”烧钱赛,李开复现身回应零一万物现状

内容摘要DeepSeek爆火冲击同行后,零一万物迅速调整业务方向,被行业认为打响战略调整第一枪。3月17日,零一万物宣布推出万智企业大模型一站式平台,为企业级DeepSeek部署定制解决方案。这也是零一披露业务调整后,创始人李开复首度现身回应。李开

DeepSeek爆火冲击同行后,零一万物迅速调整业务方向,被行业认为打响战略调整第一枪。3月17日,零一万物宣布推出万智企业大模型一站式平台,为企业级DeepSeek部署定制解决方案。这也是零一披露业务调整后,创始人李开复首度现身回应。

李开复将当下称为中国版ChatGPT Moment——“DeepSeek Moment”。他表示,DeepSeek不但是优秀的模型,且是开源模型,在国际上产生巨大影响力。

今年1月,李开复明确表态,公司未来不再做单一大模型,而是采取模型开放策略,研发能够兼容适配国内主流模型的产品。同月,零一万物宣布与阿里达成合作,共同成立“产业大模型联合实验室”,并在苏州联合七家垂直领域企业落地产业基地;2月,零一万物宣布在自有海外AI应用PopAi中接入DeepSeek-R1,成为国内AI六小虎中首家接入DeepSeek模型的公司。

转型之后,零一万物从基座大模型重投入调整为软硬件解决方案提供商。李开复表示,万智与市场上DeepSeek一体机的主要区别是提供完整的软硬件结合解决方案,价格也会比大厂产品低。

DeepSeek爆火之后,虽然推出DeepSeek一体机、DeepSeek软硬件解决方案的厂商众多,但李开复表示,企业在技术合作与技术落地方面仍面临几大挑战:一是部署方面,DeepSeek仍需要很多GPU与特殊配置,且数据安全方面仍面临如何动手部署软件的问题,而大部分一体机由集成商提供,后者在大模型方面缺乏丰富经验。

其次,在应用层面,李开复表示,由于DeepSeek是基础模型,暂时没有支持商业应用所需的FunctionCall(函数调用)、Json Output(轻量级的数据交换格式)等,且DeepSeek R1目前在指令遵循方面尚未深度优化。每个企业都有自己的行业数据库,都想实时联网降低幻觉,但DeepSeek提供的联网解决方案并不能满足所有用户的需求,有时不及时,有时不完整,此时应用的搭建对产业来说就是刚需。

第三大挑战是定制难。李开复称,DeepSeek虽然提供了开源模型,但并没有提供预训练和监督学习、强化学习的代码和解决方案。企业客户做模型需要用到SFT(监督微调)、机器训练、行业模型、预训练CPT(持续预训练),以及补充数据的蒸馏、标注等等,这些都需要一个平台来帮企业客户进行深度优化与定制服务。

目前,调整之后的零一万物不再训练万亿参数规模的超大基模,但仍会继续做轻量化模型。李开复将2025年定义为AI-First应用爆发年,“这是一个巨大的机会,也是一个考验。”他称。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1