节目

MiniMax发布推理模型对标DeepSeek,算力成本仅约53万美元

所属专辑: 一刻
主播: Wind万得
最近更新: 2天前时长: 01:16
一刻
扫码下载蜻蜓app
听书/听小说/听故事
4.5亿用户的选择
节目简介

# MiniMax推理模型发布

# 高效推理模型技术

# DeepSeek对标模型

# 算力成本优化方案

# 月之暗面开源动态

# 编程模型性能领先

# 基准测试性能突破

# 高效训练过程创新

AI大模型公司MiniMax于6月17日宣布,推出首个开源推理模型MiniMax M1,计划连续5天发布重要技术更新。该模型通过强化学习训练阶段仅耗时3周,使用512块H800 GPU完成,算力成本优化方案成效显著,总成本约53.47万美元,较预期降低一个数量级。官方称其高效推理模型技术在多项基准测试中接近海外领先模型,性能比肩DeepSeek R1和Khun3等开源模型。
同日,月之暗面开源编程模型Kimi DV72B,该模型基于阿里云Khun 2.5-72B微调而成,在SWE Bench编程基准测试中实现性能领先,超越新版DeepSeek R1,成为全球最高水平的开源编程模型之一。
两家公司同期发布技术成果,引发开发者广泛关注。MiniMax预告后续将推出更多更新,进一步展示其在高效训练过程创新与基准测试性能突破上的进展。此次动态反映了国内AI企业在模型研发与算力成本控制领域的快速迭代能力。

评论
还没有评论哦

该专辑其他节目

回到顶部
/
收听历史
清空列表