首页  问答 正文

阿里巴巴推出AI模型可在手机上处理视频和音频

　　阿里巴巴发布Qwen系列新人工智能（AI）模型，公司称该模型可处理文本、图片、音频和视频，其效率足以直接在手机和笔记本电脑上运行。

　　该公司表示，目前公开发布于Hugging Face和GitHub的这个新模型将被用于构建所谓的AI智能体，例如，可以通过实时音频描述帮助视障人士确定他们周边的状况。

　　今年全力投身这项技术以来，阿里巴巴一直在以惊人的速度发布AI产品。

　　阿里巴巴当然不是唯一一家开发多模态模型的AI开发商。OpenAI和谷歌都提供了生成式AI工具，可处理包括文本和音频在内的不同类型输入。周二，OpenAI扩展其功能，为 ChatGPT新增更先进的图像生成功能。

　　阿里巴巴在声明中表示，其新的Qwen2.5-Omni-7B系统在语音理解和生成方面性能特别高。

相关推荐

