2025-01-21 05:40:10
Künstliche Intelligenz
Technologie
Fortschritte in AI-Reasoning-Modellen
Der Presse-Radar zum Thema:
THE DECODER
DeepSeeks neuestes R1-Zero-Modell entspricht OpenAIs o1 bei Reasoning-Benchmarks
Technologie
Wirtschaft
Finanzen
DeepSeek, ein chinesisches KI-Startup, hat zwei neue Modelle, DeepSeek-R1 und DeepSeek-R1-Zero, veröffentlicht, die in der Leistung OpenAIs o1 entsprechen. DeepSeek-R1-Zero, das seine Reasoning-Fähigkeiten durch Reinforcement Learning erlernt hat, verwendet einen neuen Algorithmus namens GRPO. DeepSeek hat auch kleinere Open-Source-Versionen wie Qwen und Llama entwickelt, die bei verschiedenen Benchmarks gut abschneiden.
marktechpost.com
DeepSeek-AI veröffentlicht DeepSeek-R1-Zero und DeepSeek-R1: Die erste Generation von Reasoning-Modellen, die die Reasoning-Fähigkeit in LLMs über Reinforcement Learning fördern - MarkTechPost
Technologie
DeepSeek-AIs DeepSeek-R1-Zero und DeepSeek-R1-Modelle nutzen Reinforcement Learning, um die Reasoning-Fähigkeiten in LLMs zu verbessern. DeepSeek-R1-Zero verwendet GRPO, um das Reasoning ohne überwachte Daten zu optimieren und die Benchmark-Leistung zu verbessern. DeepSeek-R1 kombiniert Kaltstart-Daten und reasoning-fokussiertes RL, um kohärente, benutzerfreundliche Ausgaben zu erzeugen. Destillierte Modelle behalten starke Reasoning-Fähigkeiten, wobei das 14B DeepSeek-R1-Distill-Qwen-32B-Modell..
Welcome!
infobud.news ist ein KI-betriebener Nachrichtenaggregator, der weltweite Nachrichten vereinfacht und individuell anpassbare Feeds in mehreren Sprachen für maßge- schneiderte Einblicke in Technologie, Finanzen, Politik und mehr bietet. Aufgrund der Diversität der Nachrichten- quellen bietet es präzise und relevante Nachrichtenaktualisierungen, wobei es sich voll und ganz auf die Fakten fokussiert ohne dabei die Meinung zu beeinflussen. Mehr erfahrenExpand