阿里巴巴发布Qwen系列新人工智能(AI)模型,公司称该模型可处理文本、图片、音频和视频,其效率足以直接在手机和笔记本电脑上运行。
该公司表示,目前公开发布于Hugging Face和GitHub的这个新模型将被用于构建所谓的AI智能体,例如,可以通过实时音频描述帮助视障人士确定他们周边的状况。
今年全力投身这项技术以来,阿里巴巴一直在以惊人的速度发布AI产品。
阿里巴巴当然不是唯一一家开发多模态模型的AI开发商。OpenAI和谷歌都提供了生成式AI工具,可处理包括文本和音频在内的不同类型输入。周二,OpenAI扩展其功能,为 ChatGPT新增更先进的图像生成功能。
阿里巴巴在声明中表示,其新的Qwen2.5-Omni-7B系统在语音理解和生成方面性能特别高。