小米MiMo-V2-Omni：全能智能体时代的感知与行动

MiMo-V2-Omni多模态模型智能体感知与行动自动驾驶跨模态理解长音频分析

小米发布全新全能基础模型MiMo-V2-Omni，融合多模态感知与强大多智能体能力，支持图像、视频、音频及文本的同步处理，并具备实时决策与工具调用功能，旨在推动下一代智能体在现实世界中的可靠行动。