2025-09-23 16:55:09
Asien
Künstliche Intelligenz
Technologie

Alibabas Qwen3-Omni: Ein Wendepunkt in der multimodalen KI-Technologie

Alibabas jüngste Einführung des Qwen3-Omni markiert einen bedeutenden Fortschritt in der künstlichen Intelligenz. Dieses innovative multimodale KI-Modell verarbeitet nahtlos Text, Bilder, Audio und Video und zeigt seine Vielseitigkeit in Echtzeitanwendungen.

Mit 30 Milliarden Parametern übertrifft Qwen3-Omni in zahlreichen Benchmarks etablierte Modelle wie GPT-4o. Seine Fähigkeit, eine breite Palette von Sprachen zu unterstützen, verbessert seine Zugänglichkeit und Funktionalität.

Darüber hinaus stellte Alibaba Qwen3-Next vor, ein schnelleres Sprachmodell mit einer angepassten Architektur, das für eine verbesserte Leistung bei verschiedenen Aufgaben entwickelt wurde. Dieser doppelte Ansatz positioniert Alibaba als einen starken Konkurrenten in der KI-Landschaft und stellt eine Herausforderung für große Akteure wie OpenAI und Google dar.

THE DECODER
23. September 2025 um 11:01

Alibaba stellt Qwen3-Omni vor, ein KI-Modell, das Text, Bilder, Audio und Video verarbeitet

Alibaba hat Qwen3-Omni vorgestellt, ein natives multimodales KI-Modell, das Text, Bilder, Audio und Video in Echtzeit verarbeiten kann. Das 30-Milliarden-Parameter-Modell übertrifft etablierte Modelle wie Gemini 2.5 Flash und GPT-4o in 32 von 36 Benchmarks. Qwen3-Omni ist in der Lage, nahtloses Streaming zu ermöglichen und unterstützt die Verarbeitung von Text in 119 Sprachen, 19 gesprochene Sprachen und kann in 10 Sprachen antworten.
Big Tech - South China Morning Post
23. September 2025 um 10:30

Alibaba challenges OpenAI’s GPT-4o and Google’s Nano Banana with new multimodal AI model

Alibaba has unveiled a new multimodal AI model called Qwen3-Omni, rivaling OpenAI's GPT-4o and Google's Gemini 2.5-Flash ('Nano Banana'). The model can process text, audio, images, and video inputs, responding with text and audio outputs. Benchmark tests showed two variants of Qwen3-Omni outperforming their predecessor and competing models in tasks such as audio recognition and image understanding.
Webrazzi
23. September 2025 um 13:00

Alibaba's Open-Source Multi-Modal AI Model: Qwen3-Omni Processes Multiple Inputs in Real-Time

Alibaba, yeni Qwen3-Omni açık kaynak yapay zeka modelini duyurdu. Bu model, metin, görüntü, ses ve video girdilerini tek seferde işleyebilen ilk 'yerel uçtan uca omni-modal yapay zeka' olarak konumlandırılıyor. Model, gerçek zamanlı olarak yanıt vermeye devam ederken girdi alıp çıktı verebiliyor ve 119 dil desteğine sahip.
THE DECODER
23. September 2025 um 11:15

Alibaba's Qwen3-Next builds on a faster MoE architecture

Alibaba has released Qwen3-Next, a new language model built on a customized MoE architecture that runs faster than its predecessors without sacrificing performance. The model includes several tweaks to stabilize training and is available in two specialized versions: Instruct for general-purpose tasks and Thinking for reasoning-heavy problems. The Thinking model reportedly outperforms Google's Gemini 2.5 Flash Thinking on certain benchmarks and comes close to Alibaba's own top-tier Qwen3-235B-A..
KW

Account

Warteliste für den personalisierten Bereich


Welcome!

InfoBud.news

infobud.news ist ein KI-betriebener Nachrichtenaggregator, der weltweite Nachrichten vereinfacht und individuell anpassbare Feeds in mehreren Sprachen für maßge- schneiderte Einblicke in Technologie, Finanzen, Politik und mehr bietet. Aufgrund der Diversität der Nachrichten- quellen bietet es präzise und relevante Nachrichtenaktualisierungen, wobei es sich voll und ganz auf die Fakten fokussiert ohne dabei die Meinung zu beeinflussen. Mehr erfahrenExpand