LongCat-Next：基于离散原生自回归范式的多模态统一建模

LONGCAT-NEXT多模态模型离散表示DINA视觉理解语音合成

美团 LongCat 团队提出 LongCat-Next 模型，通过离散原生自回归（DiNA）范式实现文本、视觉与音频的统一建模，在理解、生成与语音任务中表现优异。