美团今天在 AI 领域搞了个大动作,开源了全模态大模型LongCat-Flash-Omni。这个模型是业界首个实现"全模态覆盖、端到端架构、大参数量高效推理"于一体的开源大语言模型。 新模型在开源范畴内实现了对标闭源模型的全模态能力,这意味着它能像 GPT-4o 那样看图、听音、读文本,还实时对话。最让人眼前一亮的是它的响应速度凭借创新的架构设计与工程优化,让大参数模型在多模态任务中实现毫秒级响应。体验地址:LongCat-Flash-Omni