X

OpenAI enthüllt einen Teil der Architektur seines neuen generativen KI-Modells

OpenAI enthüllt einen Teil der Architektur seines neuen generativen KI-Modells
Yesterday 09:37
Zoom

Sam Altman, CEO von OpenAI, gab am Montag bekannt, dass das Startup einen Teil der Architektur eines neuen Modells für generative künstliche Intelligenz (KI) enthüllen werde. Dies sei ein strategischer Wandel, nachdem das Unternehmen seine Programme und Methoden seit der Einführung von ChatGPT eifersüchtig geheim gehalten hatte.
OpenAI wird offene Gewichtungsparameter anbieten, d. h. Kriterien, die die Funktionsweise eines Modells definieren und es nach seiner Entwicklung leiten.

„Open Weight“ unterscheidet sich von „Open Source“, also dem freien Zugriff auf den Programmiercode des Modells selbst. Es ist eingeschränkter und erlaubt uns nicht zu bestimmen, wie eine generative KI-Schnittstelle aufgebaut ist.

Experten kritisieren mehrere Akteure im Bereich der generativen KI, weil sie behaupteten, offenen Zugang anzubieten, während sie sich in Wirklichkeit auf die Gewichtung beschränkten.

Der Zugriff auf die Gewichtung kann Entwicklern dabei helfen, ein OpenAI-Modell an ihre spezifischen Anforderungen anzupassen.

„Wir haben lange darüber nachgedacht, aber andere Prioritäten haben Vorrang gehabt“, erklärte Sam Altman auf X (ehemals Twitter) und erinnerte daran, dass Open AI seit der Einführung von GPT 2 im Jahr 2019 keine Details eines Modells mehr veröffentlicht habe.

ChatGPT, im November 2022 eingeführt, basierte auf GPT 3.5.

Das erwähnte Modell werde „in den kommenden Monaten“ veröffentlicht, sagte Kevin Weil, Produktmanager bei OpenAI, gegenüber X.

In naher Zukunft wird das Startup Veranstaltungen in San Francisco, Europa und Asien abhalten, bei denen Programmierer das Modell testen und ihre Eindrücke und Vorschläge austauschen können.

Bislang war OpenAI neben Anthropic einer der wenigen Schwergewichte der generativen KI, der nichts über die Funktionsweise seiner Modelle preisgab.

Meta, Google und Mistral haben sich alle dafür entschieden, einen Teil ihrer Architektur zu veröffentlichen, ebenso wie das chinesische Unternehmen DeepSeek, dessen R1-Modell im Januar die Welt der generativen KI aufrüttelte.

Fügen Sie Ihren Kommentar hinzu

300 / Verbleibende Zeichen 300
Veröffentlichungsbedingungen : Beleidigen Sie nicht den Autor, Personen, Heiligtümer, greifen Sie keine Religionen oder die Gottheit an, vermeiden Sie rassistische Anstiftung und Beleidigungen

Kommentare (0)

Die in den Kommentaren geäußerten Meinungen spiegeln nur die Meinungen ihrer Autoren wider und nicht die von Lou.Press

Mehr lesen