yqk 勾引
栏目分类
热点资讯
好看的第四色

你的位置:yqk 勾引 > 好看的第四色 > 人体艺术汤加丽 阿里发布Qwen2.5-Omni,堪称全办法多模态感知、看传说写样样精明

人体艺术汤加丽 阿里发布Qwen2.5-Omni,堪称全办法多模态感知、看传说写样样精明

发布日期:2025-03-27 21:17    点击次数:158

人体艺术汤加丽 阿里发布Qwen2.5-Omni,堪称全办法多模态感知、看传说写样样精明

今天,咱们发布了 Qwen2.5-Omni人体艺术汤加丽,Qwen 模子家眷中新一代端到端多模态旗舰模子。该模子专为全办法多模态感知想象,大要无缝经管文本、图像、音频和视频等多种输入形状,并通过及时流式反应同期生成文本与当然语音合成输出。

该模子现已在 Hugging Face、ModelScope、DashScope 和 GitHub上开源灵通,你不错通过咱们的Demo体验互动功能,或是通过Qwen Chat 平直发起语音或视频聊天,千里浸式体验全新的 Qwen2.5-Omni 模子庞大性能。

主要特色

万能立异架构:咱们提议了一种全新的Thinker-Talker架构,这是一种端到端的多模态模子,旨在扶助文本/图像/音频/视频的跨模态勾通,同期以流式方式生成文本和当然语音反应。咱们提议了一种新的位置编码时间,称为TMRoPE(Time-aligned Multimodal RoPE),通落后期轴对都兑现视频与音频输入的精确同步。

99bt

及时音视频交互:架构旨在扶助十足及时交互,扶助分块输入和即时输出。

当然通顺的语音生成:在语音生成的当然性和强壮性方面越过了好多现存的流式和非流式替代决议。

全模态性能上风:在同等范围的单模态模子进行基准测试时,阐扬出超卓的性能。Qwen2.5-Omni在音频能力上优于相同大小的Qwen2-Audio,并与Qwen2.5-VL-7B保握同等水平。

超卓的端到端语音指示随从能力:Qwen2.5-Omni在端到端语音指示随从方面阐扬出与文本输入经管相比好意思的成果,在MMLU通用学问勾通和GSM8K数学推理等基准测试中阐扬优异。

 

点击不雅看Qwen2.5-Omni-7B demo

模子架构

Qwen2.5-Omni接受Thinker-Talker双核架构。Thinker 模块如同大脑,讲求经管文本、音频、视频等多模态输入,生成高层语义表征及对应文本实质;Talker 模块则相同发声器官,以流式方式继承 Thinker及时输出的语义表征与文本,通顺合成闹翻语音单位。Thinker 基于 Transformer 解码器架构,交融音频/图像编码器进行特征索要;Talker则接受双轨自追想 Transformer 解码器想象,在检修和推理经由中平直继承来自 Thinker 的高维表征,并分享一起历史险阻文信息,酿成端到端的颐养模子架构。

模子架构图

模子性能

Qwen2.5-Omni在包括图像,音频,音视频等多样模态下的阐扬都优于相同大小的单模态模子以及禁闭源模子,举例Qwen2.5-VL-7B、Qwen2-Audio和Gemini-1.5-pro。

在多模态任务OmniBench,Qwen2.5-Omni达到了SOTA的阐扬。此外,在单模态任务中,Qwen2.5-Omni在多个领域中阐扬优异,包括语音识别(Common Voice)、翻译(CoVoST2)、音频勾通(MMAU)、图像推理(MMMU、MMStar)、视频勾通(MVBench)以及语音生成(Seed-tts-eval和主不雅当然听人体艺术汤加丽感)。

模子性能图

下一步

咱们期待听到您的反馈,并看到您使用 Qwen2.5-Omni 建设的立异行使。在不久的改日,咱们将效用增强模子对语音指示的受命能力,并普及音视频协同勾通能力。更值得期待的是,咱们将握续拓展多模态能力界限,以发展成为一个全面的通用模子!

体验方式

Qwen Chat:https://chat.qwenlm.ai

Hugging Face:https://huggingface.co/Qwen/Qwen2.5-Omni-7B

ModelScope:https://modelscope.cn/models/Qwen/Qwen2.5-Omni-7B

DashScope:https://help.aliyun.com/zh/model-studio/user-guide/qwen-omni

GitHub:https://github.com/QwenLM/Qwen2.5-Omni

Demo体验:https://modelscope.cn/studios/Qwen/Qwen2.5-Omni-Demo

本文开首:通义千问Qwen,原文标题:《Qwen2.5-Omni:看,听,说,写,样样精明!》。

风险提醒及免责条目 阛阓有风险,投资需严慎。本文不组成个东说念主投资建议,也未洽商到个别用户突出的投资筹画、财务景色或需要。用户应试虑本文中的任何主见、不雅点或论断是否稳当其特定景色。据此投资,遭殃自夸。

友情链接:

Powered by yqk 勾引 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024