2025-01-21 05:40:10
Künstliche Intelligenz
Technologie

Fortschritte in AI-Reasoning-Modellen

DeepSeek-AI hat seine erste Generation von Reasoning-Modellen vorgestellt, DeepSeek-R1-Zero und DeepSeek-R1, die verstärkendes Lernen nutzen, um die Reasoning-Fähigkeiten großer Sprachmodelle (LLMs) erheblich zu verbessern. Das DeepSeek-R1-Zero-Modell optimiert die Reasoning-Leistung, ohne sich auf überwachte Daten zu stützen, und erreicht eine bemerkenswerte Erfolgsquote von 71,0 % beim AIME 2024 Benchmark.

Währenddessen integriert DeepSeek-R1 Cold-Start-Daten, um kohärente und benutzerfreundliche Ausgaben sicherzustellen, wobei das 14B DeepSeek-R1-Distill-Qwen-32B Modell eine Erfolgsquote von 72,6 % erreicht. Diese Modelle, die unter der MIT-Lizenz verfügbar sind, versprechen verbesserte mehrsprachige Unterstützung und effiziente Software-Engineering-Fähigkeiten.

Da der Wettbewerb im KI-Bereich zunimmt, deuten die Angebote von DeepSeek auf eine wachsende Fähigkeit chinesischer KI-Labore hin, mit etablierten Akteuren wie OpenAI gleichzuziehen und sie möglicherweise zu übertreffen.

TechCrunch
20. Januar 2025 um 17:44

DeepSeek behauptet, sein Reasoning-Modell übertreffe OpenAIs o1 bei bestimmten Benchmarks

Technologie
Politik
Das chinesische KI-Labor DeepSeek hat eine offene Version seines Reasoning-Modells, DeepSeek-R1, veröffentlicht, das es bei bestimmten Benchmarks wie AIME, MATH-500 und SWE-bench Verified gut abschneiden soll. R1 ist unter einer MIT-Lizenz auf Hugging Face verfügbar.
THE DECODER
20. Januar 2025 um 18:00

DeepSeeks neuestes R1-Zero-Modell entspricht OpenAIs o1 bei Reasoning-Benchmarks

Technologie
Wirtschaft
Finanzen
DeepSeek, ein chinesisches KI-Startup, hat zwei neue Modelle, DeepSeek-R1 und DeepSeek-R1-Zero, veröffentlicht, die in der Leistung OpenAIs o1 entsprechen. DeepSeek-R1-Zero, das seine Reasoning-Fähigkeiten durch Reinforcement Learning erlernt hat, verwendet einen neuen Algorithmus namens GRPO. DeepSeek hat auch kleinere Open-Source-Versionen wie Qwen und Llama entwickelt, die bei verschiedenen Benchmarks gut abschneiden.
marktechpost.com
21. Januar 2025 um 04:27

DeepSeek-AI veröffentlicht DeepSeek-R1-Zero und DeepSeek-R1: Die erste Generation von Reasoning-Modellen, die die Reasoning-Fähigkeit in LLMs über Reinforcement Learning fördern - MarkTechPost

Technologie
DeepSeek-AIs DeepSeek-R1-Zero und DeepSeek-R1-Modelle nutzen Reinforcement Learning, um die Reasoning-Fähigkeiten in LLMs zu verbessern. DeepSeek-R1-Zero verwendet GRPO, um das Reasoning ohne überwachte Daten zu optimieren und die Benchmark-Leistung zu verbessern. DeepSeek-R1 kombiniert Kaltstart-Daten und reasoning-fokussiertes RL, um kohärente, benutzerfreundliche Ausgaben zu erzeugen. Destillierte Modelle behalten starke Reasoning-Fähigkeiten, wobei das 14B DeepSeek-R1-Distill-Qwen-32B-Modell..
KW

Account

Warteliste für den personalisierten Bereich


Welcome!

InfoBud.news

infobud.news ist ein KI-betriebener Nachrichtenaggregator, der weltweite Nachrichten vereinfacht und individuell anpassbare Feeds in mehreren Sprachen für maßge- schneiderte Einblicke in Technologie, Finanzen, Politik und mehr bietet. Aufgrund der Diversität der Nachrichten- quellen bietet es präzise und relevante Nachrichtenaktualisierungen, wobei es sich voll und ganz auf die Fakten fokussiert ohne dabei die Meinung zu beeinflussen. Mehr erfahrenExpand