清华团队开源大模型推理引擎赤兔,实现DeepSeek推理成本降低一半
IT之家 3 月 14 日消息,清华大学高性能计算研究所翟季冬教授团队、清华系科创企业清程极智今日联合宣布,大模型推理引擎“赤兔 Chitu”现已开源。
据介绍,该引擎首次实现在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行 FP8 精度模型,实现 DeepSeek 推理成本降低一半、性能翻番。其定位为“生产级大模型推理引擎”,提供如下特性:
多元算力适配:不仅支持 NVIDIA 最新旗舰到旧款的多系列产品,也为国产芯片提供优化支持。
全场景可伸缩:从纯 CPU 部署、单 GPU 部署到大规模集群部署,赤兔引擎提供可扩展的解决方案。
长期稳定运行:可应用于实际生产环境,稳定性足以承载并发业务流量。
官方表示,当前开源的赤兔引擎在部署 DeepSeek-R1-671B 满血版时,在 A800 集群的测试中,相比部分国外开源框架,实现了 GPU 使用量减少 50% 的同时,推理速度提升 3.15 倍。
IT之家附开源地址:
https://github.com/thu-pacman/chitu
相关阅读:
- 2025-03-14 22:31:00 王忠林主持召开省委常委会会议
- 2025-03-14 20:22:00 腾讯游戏《矩阵:零日危机》全球限量删档「相位测试」开启
- 2025-03-14 20:07:00 清华团队开源大模型推理引擎赤兔,实现DeepSeek推理成本降低一半
- 2025-03-14 15:39:00 七彩虹推出低阶AMD B850主板战斧BATTLE-AX B850M-E WIFI V14
- 2025-03-14 15:29:00 技嘉发布MO27U2 QD-OLED显示器:4K 240Hz,0.03毫秒响应时间
- 2025-03-14 15:03:00 国内首个热力行业多场景智慧客服系统正式发布