Google Gemini neu “besser” als ChatGPT4p

18. Nov.

Google hat's getan: Das neue Gemini Model ist da und stürmt direkt an die Spitze des LLM Leaderboards!

Was ist das Chatbot Arena LLM Leaderboard?

Das Chatbot Arena LLM Leaderboard gibt einen Überblick darüber, wie gut die verschiedenen grossen Sprachmodelle (LLMs) unter realen Bedingungen performen. Konkret werden Leistungsfähigkeit in Bereichen wie Sprachverständnis, Wissensabdeckung, Problemlösung und generative Fähigkeiten getestet.

Diese Tests werden von einer Million Nutzer*innen durchgeführt, die jeweils anonymisierte Resultate erhalten und bewerten müssen. Wichtig dabei: Die Bewertungen basieren oft auf subjektiven Eindrücken, und nicht alle realen Anwendungsfälle werden berücksichtigt. Bei der grossen Anzahl der Nutzer hat für mich dieser Benchmark dennoch eine spannende Aussagekraft.

Die aktuellen Resultate

Gemini übertrifft derzeit alle, inklusive ChatGPT. Aber je nach Disziplin haben andere Modelle die Nase vorn.

Bildschirmfoto 2024-11-18 um 16.00.20.png

Bildschirmfoto 2024-11-18 um 16.00.49.png

Bildschirmfoto 2024-11-18 um 16.01.09.png

Eine kleine Erklärung: Gemini ist das Large Language Model von Google, ChatGPT natürlich von OpenAI, Grok von “Twitter” (xAI), Claude von Anthropic und Lama von Meta. Letzteres als einziges ist “quasi” Open Source. Daher nutzt auch NVIDIA das Model und ist als Herausgeber aufgeführt. Zhipu AI ist eine chinesische AI-Company.

Doch was bedeutet das in der Praxis? Die wahre Frage ist: Wie gut lässt sich ein Model in den Alltag integrieren? Hier bleibt ChatGPT mit seiner umfassenden Nutzeroberfläche – Websuche, Canva-Integration und weiteren Productivity-Tools – momentan unschlagbar, wenn es um praktische Anwendung geht.

Wenn wir bei uns oder Powdience neue AI-basierte Tools und Prozesse entwickeln, nutzen wir manchmal für Teilprozesse jeweils verschiedene Tools. Bei den Social Media Content Analysen für LinkedIn oder Instagram (www.powdience.com/instagram-ai) wird ChatGPT für Bildanalysen, Gemini für bestimmte Video-Analysen und eigene Modelle z.B. zur Generierung der Fazits eingesetzt.

Welche Prozesse kann man bei dir mit AI boosten?

geminigooglechatgptopenaianthropicranking