小米MiMo-V2-Omni:全能智能体时代的感知与行动

MiMo-V2-Omni多模态模型智能体感知与行动自动驾驶跨模态理解长音频分析
小米发布全新全能基础模型MiMo-V2-Omni,融合多模态感知与强大多智能体能力,支持图像、视频、音频及文本的同步处理,并具备实时决策与工具调用功能,旨在推动下一代智能体在现实世界中的可靠行动。
Generated from mimo.xiaomi.com
Mar 19, 2026

Scroll to Zoom • Drag to Pan