国产大模型推理引擎“赤兔”开源

更新时间：2025-03-19 12:09:26 发布时间：2小时前评论：0

收藏

分享

内容摘要本报讯（记者赵广立）3月14日，清华大学高性能计算研究所教授翟季冬团队与清华系科创企业清程极智联合宣布，开源大模型推理引擎“赤兔Chitu”。据介绍，该引擎首次实现在非英伟达Hopper架构图形处理器（GPU）及各类国产芯片上原生运行FP8

本报讯（记者赵广立）3月14日，清华大学高性能计算研究所教授翟季冬团队与清华系科创企业清程极智联合宣布，开源大模型推理引擎“赤兔Chitu”。据介绍，该引擎首次实现在非英伟达Hopper架构图形处理器（GPU）及各类国产芯片上原生运行FP8精度模型，为国产人工智能（AI）芯片的广泛应用和生态建设扫除了障碍。

当前，FP8精度模型长期依赖英伟达H系列高端GPU，这使得国内企业在部署大模型时受到AI芯片的限制。为打破这一困境，清华大学与清程极智联合开源的赤兔推理引擎通过底层技术革新，首次实现了非H卡设备对原生FP8精度模型的高效部署，摆脱对特定硬件的依赖，极大降低了企业部署AI模型的门槛和成本。

翟季冬介绍说，赤兔凝结了团队多年并行计算与编译优化技术的积累，目标是弥合先进模型与多样化硬件之间的差距，让国产算力真正“跑起来”。

“赤兔的定位是成为连接多元算力与大模型应用的桥梁。”清程极智CEO汤雄超表示，“我们的引擎不仅支持英伟达全系列GPU，还针对国产芯片深度优化，未来将陆续开源适配版本。”

据悉，在首期开源版本中，赤兔引擎部署DeepSeek-R1-671B满血版时相比部分国外开源框架，在GPU使用量减少50%的情况下推理速度仍有3.15倍提速。

另据了解，清程极智还推出了基于赤兔的“推理一体机”，提供开箱即用部署方案及专业运维服务，进一步简化企业AI落地流程。

举报收藏打赏 评论 0

版权声明 本文仅代表作者观点，不代表本站立场。
如遇本文系为网络转载到本站发表，图片或文章有版权问题的请联系客服确认后会立即删除文章。
如遇本文系作者授权本站发表，未经许可，不得转载。

--结束END--

有问题投稿请发送至: 邮箱/

本文标题: 国产大模型推理引擎“赤兔”开源

本文链接: http://meilagrina.com/news/show-423198.html (转载时请保留)

0 条

配5颗激光雷达：极氪9X光辉首发千里浩瀚H9智驾方案

科技 tjskytd ⋅ 12阅读量 ⋅ 0评论 ⋅ 6分钟前

2025-03-19
NVIDIA发布12款Blackwell RTX PRO专业显卡：最高96GB大显存、600W高功耗

科技 kfzthg ⋅ 17阅读量 ⋅ 0评论 ⋅ 6分钟前

2025-03-19
安卓第三款3nm芯片来袭：谷歌打造看齐高通联发科

科技 sjzlingbu ⋅ 5阅读量 ⋅ 0评论 ⋅ 6分钟前

2025-03-19
AMD RX 9070 OEM版真卡首曝：没有公版就买它了

科技 hxkjyjn ⋅ 1阅读量 ⋅ 0评论 ⋅ 6分钟前

2025-03-19
哪吒汽车辟谣解散研发团队：不实传闻正推动进一步降本增效

科技 eagletomhuang ⋅ 7阅读量 ⋅ 0评论 ⋅ 6分钟前

2025-03-19
确认了！AMD下代Zen6 APU无缘RDNA 4：继续使用RDNA 3.5

科技 cgskxhxt ⋅ 6阅读量 ⋅ 0评论 ⋅ 6分钟前

2025-03-19
小折叠之王！联想moto 2024年Q4全球竖向折叠屏市场夺得第一

科技 bkmei ⋅ 18阅读量 ⋅ 0评论 ⋅ 6分钟前

2025-03-19
新势力周销量“民间榜”出炉：有一车企跌出前十

科技 youkouxiangbao ⋅ 5阅读量 ⋅ 0评论 ⋅ 6分钟前

2025-03-19
定位30万级插混MPV！别克GL8陆尚上半年上市：采用“一口价“”模式

科技 blackrose6819 ⋅ 8阅读量 ⋅ 0评论 ⋅ 6分钟前

2025-03-19
超频能力媲美顶级非公！索泰RTX 5070 SOLID OC评测

科技 gzhydsjzp ⋅ 1阅读量 ⋅ 0评论 ⋅ 6分钟前

2025-03-19

云天励飞2024增亏 2023上市即巅峰募39亿中信证券保荐

行业站长 ⋅ 3阅读量 ⋅ 0评论 ⋅ 8分钟前

2025-03-19
连亏股科蓝软件实控人方被强制执行 8年3募资近11亿

行业站长 ⋅ 17阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
利元亨2024年增亏 2021年上市两募资共18亿元

行业站长 ⋅ 11阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
连亏股芳源股份某股东拟减持 2021年上市两募资共10亿



行业站长 ⋅ 17阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
精进电动2024年续亏 2021年上市募20.3亿元

行业站长 ⋅ 14阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
四川太极制药被列入"违规名单" 为太极集团子公司

行业站长 ⋅ 6阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
江苏华辰不超4.6亿可转债获上交所通过甬兴证券建功

行业站长 ⋅ 10阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
午评：两市窄幅震荡电力板块强势



行业站长 ⋅ 7阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
今日上市：恒鑫生活

行业站长 ⋅ 4阅读量 ⋅ 0评论 ⋅ 2小时前

2025-03-19
华润啤酒业绩“双降”，白酒营业额增速明显放缓

行业站长 ⋅ 7阅读量 ⋅ 0评论 ⋅ 2小时前

2025-03-19

云天励飞2024增亏 2023上市即巅峰募39亿中信证券保荐

经济资讯站长 ⋅ 8阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
连亏股科蓝软件实控人方被强制执行 8年3募资近11亿

经济资讯站长 ⋅ 20阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
利元亨2024年增亏 2021年上市两募资共18亿元

经济资讯站长 ⋅ 10阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
连亏股芳源股份某股东拟减持 2021年上市两募资共10亿



经济资讯站长 ⋅ 9阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
精进电动2024年续亏 2021年上市募20.3亿元

经济资讯站长 ⋅ 16阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
四川太极制药被列入"违规名单" 为太极集团子公司

经济资讯站长 ⋅ 1阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
江苏华辰不超4.6亿可转债获上交所通过甬兴证券建功

经济资讯站长 ⋅ 6阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
午评：两市窄幅震荡电力板块强势



经济资讯站长 ⋅ 9阅读量 ⋅ 0评论 ⋅ 9分钟前

2025-03-19
今日上市：恒鑫生活

经济资讯站长 ⋅ 16阅读量 ⋅ 0评论 ⋅ 2小时前

2025-03-19
华润啤酒业绩“双降”，白酒营业额增速明显放缓

经济资讯站长 ⋅ 11阅读量 ⋅ 0评论 ⋅ 2小时前

2025-03-19

1瑞典克朗等于多少人民币（2025年3月19日）

商业与经济 gzwenjun ⋅ 20阅读量 ⋅ 0评论 ⋅ 26秒前

2025-03-19
游戏制作游戏推荐哪个十大必玩游戏制作游戏盘点

科技 gzwenjun ⋅ 9阅读量 ⋅ 0评论 ⋅ 2小时前

2025-03-19
国产大模型推理引擎“赤兔”开源

科技 gzwenjun ⋅ 20阅读量 ⋅ 0评论 ⋅ 2小时前

2025-03-19
英伟达将与电信企业合作开发基于人工智能的 6G 无线通信技术

科技 gzwenjun ⋅ 17阅读量 ⋅ 0评论 ⋅ 9小时前

2025-03-19
（2025年03月17日）最新聚乙烯（PE）价格行情走势查询

农村致富 gzwenjun ⋅ 11阅读量 ⋅ 0评论 ⋅ 1天前

2025-03-17
广东湛江连夜检查“保水虾仁” 责令立即停止销售涉事产品

商业与经济 gzwenjun ⋅ 1阅读量 ⋅ 0评论 ⋅ 3天前

2025-03-16
民之所需行之所至：山东电信全天候随心服务“共筑满意消费”

科技 gzwenjun ⋅ 17阅读量 ⋅ 0评论 ⋅ 3天前

2025-03-15
小米新机通过 3C 认证，预计为 REDMI Turbo 4 Pro

科技 gzwenjun ⋅ 15阅读量 ⋅ 0评论 ⋅ 3天前

2025-03-15
沪上年轻人：Citywalk不香了，流行挖野菜

科技 gzwenjun ⋅ 7阅读量 ⋅ 0评论 ⋅ 4天前

2025-03-14
（2025年03月14日）今日二甲苯价格行情查询

五金 gzwenjun ⋅ 15阅读量 ⋅ 0评论 ⋅ 4天前

2025-03-14

去ta空间

24小时热闻

今日推荐

(c)2016-2021 SOQUANMAO.COM All Rights Reserved搜全贸版权所有浙ICP备19001410号-1

浙ICP备19001410号-1