小米首个推理大模型开源...
4月30日,小米开源首个推理大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。目前,MiMo-7B 已开源4个模型至HuggingFace。
在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 用 7B 的参数规模,超越了OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。
就在昨天,阿里巴巴宣布开源新一代通义千问模型Qwen3。千问3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型。另有市场消息透露,DeepSeek的R2也即将发布。
文档于: 2025-04-30 11:15 修改
标签:
评论列表
小米首个推理大模型开源...
4月30日,小米开源首个推理大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。目前,MiMo-7B 已开源4个模型至HuggingFace。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集...