Generative Künstliche Intelligenz und Immobilien – Marktüberblick und Kosten
Die letzten beiden Beiträge haben einen Einblick in genAI-Modelle gegeben, dabei sind die Namen „ChatGPT“ und „OpenAI“ bereits gefallen. Das sind Tools bzw. Anbieter, die wahrscheinlich jeder von euch kennt und direkt mit genAI in Verbindung bringt (oder sogar als Synonyme verwendet). Aber gibt es da nicht noch mehr?
Welche Modelle gibt es am Markt?
Vorab: Der Bereich der generativen Künstlichen Intelligenz ist viel größer als ChatGPT von OpenAI. Unter „generativer“ KI versteht man jede KI, die aus einem Input etwas Neues, zuvor nicht Dagewesenes generiert. ChatGPT fällt hierbei in das Segment „Text-to-Text“ bzw. „Text-to-Image“. Es gibt aber auch noch viele weitere Bereiche wie „Text-to-Voice“, „Voice-to-Text“, „Text-to-Code“, „Text-to-Video“, „Image-to-3D-Animation“, … (ihr könnt diese Begriffe mittlerweile eigentlich beliebig kombinieren).
OpenAI ist mit Sicherheit der bekannteste Anbieter in einigen dieser Bereiche. Zum einen führen sie seit langer Zeit die Leaderboards der leistungsstärksten Modelle an (daran rütteln einige Anbieter derzeit), zum anderen sind sie auch im Marketing am besten. Sie waren tatsächlich aber nicht die ersten, die derartige Modelle erschaffen haben.
Neben OpenAI’s GPT4 sind die derzeit leistungsfähigsten Modelle Claude 3 Opus von Anthropic (Amazon), Gemini Pro 1.5 von Google und Command R+ von Cohere. Die Unterschiede zwischen den Modellen sind relativ gering (alle verfügbar bei Microsoft Azure, AWS oder Google Cloud) und es hängt von der Aufgabe ab, welches Modell am besten geeignet ist (AlphaPrompt wählt bei jeder Aufgabe aus, an welches Modell diese übermittelt wird und nutzt so diese Unterschiede aus).
Was kosten diese Modelle?
Die oben genannten Modelle sind alle in der Hand der jeweiligen Unternehmen und nur gegen eine Nutzungsgebühr verwendbar. Hierbei zahlt man pro Token (= ~0,75 Wörter), wobei 1 Million Token bei diesen Modellen derzeit noch zwischen 10 und 30 Dollar kosten. Es ist aber davon auszugehen, dass die Kosten hierfür in den kommenden Monaten noch deutlich geringer werden (weil die Modelle effizienter werden und weniger Rechenleistung benötigen).
Außerdem benötigt man nicht immer diese leistungsstarken Modelle und kann viele Aufgaben durch die kleineren und damit günstigeren Modelle dieser Anbieter lösen lassen (auch diesen Aspekt berücksichtigt AlphaPrompt bei der Modellauswahl). Zum Beispiel benötigen Zusammenfassungen oder Übersetzungen nicht die gleichen Ressourcen wie eine komplexe Standortanalyse. Diese Modelle kosten schon jetzt deutlich unter 1 USD pro Millionen Tokens.
Empfohlen von LinkedIn
Zuletzt möchte ich aber auch noch erwähnen, dass es einige und immer mehr Open-Source-Lösungen gibt, die fast ganz oben mitmischen. Mistral aus Frankreich oder die Llama-Modelle von Meta gehören dazu. Diese Modelle können theoretisch auch lokal auf dem eigenen Rechner oder Server eingesetzt werden (aus Perspektive des Datenschutzes natürlich sehr toll) und verursachen außer der Rechenleistung keine weiteren Kosten. Eine zunehmende Zahl von Experten geht übrigens davon aus, dass Open-Source die Zukunft ist: Es wird so viele auch sehr gute Open-Source-Modelle geben, dass es die oben genannten Anbieter mit ihrem derzeitigen Business-Modell schwer haben werden (OpenAI investiert genau deshalb mittlerweile riesige Summen in eigene Chips bzw. Rechenzentren – hier wird das neue „Gold“ vermutet).
Wie schnell werden sich diese Modelle weiterentwickeln?
Mit fortschreitender Entwicklung werden die Modelle günstiger und besser. Das letzte große Update war sicherlich die Einführung von GPT4 im März 2023, doch wann steht das nächste Update an? GPT5 wird vermutlich nicht mehr dieses Jahr kommen, sondern wahrscheinlich Anfang 2025.
Ich habe noch ein sehr gutes Beispiel, wie schnell Entwicklungen vonstattengehen: Anfang 2024 waren sich genAI-Enthusiasten noch einig, es wird 2024 vermutlich noch keine Text-to-Video-Anwendungen geben, die hochwertige Videos länger als ein paar Sekunden generieren können. Bereits im März hat OpenAI mit „Sora“ ein Text-to-Video-Modell vorgestellt, das Videos bis zu einer Minute Länge in fotorealistischer Qualität (wenn gewünscht) produzieren kann. Mittlerweile gibt es einige Tools, die in diese Richtung gehen, und ich bin sehr gespannt, wann der erste genAI-Film-Blockbuster angekündigt wird (meine Vermutung: Ende 2024).
Wenn ich dein Interesse geweckt habe, dann freue ich mich über dein Abo.
See u every Thursday, Nino
Farming Olives, fruits and wine ... Investor (already fully invested)
6 MonateIch bin noch nie in irgendeinem anderen Zusammenhang meines bisherigen professionellen Lebens in der IT auf so viel Halbwahrheiten und Halbwissen gestoßen, wie im Zusammenhang mit generativer AI. Deine Beiträge sind hilfreich, weil sie die Leser am Anfang abholen und erklären statt zu belehren oder einfach nur zu behaupten. Man kann nicht verstehen, wo diese Technologie am Ende wirklich nützlich sein wird, wenn man sie generell falsch versteht, falsch einsortiert oder sie auch einfach überschätzt. Danke, dass Du Dir die Mühe machst, neben der Entwicklung Eures StartUps auch noch allgemeine Wissensdefizite auszugleichen. Jeder wird Dir verzeihen, dass Du gelegentlich darauf hinweist, dass Alpha Prompt natürlich berücksichtigt, was wirklich möglich und nötig ist. Freu mich auf die Fortsetzung.