Generativní AI při tvorbě e‑learningu: Je lepší Dall-E, nebo Midjourney?

Generativní AI při tvorbě e‑learningu: Je lepší Dall-E, nebo Midjourney?

V digitálním vzdělávání, kde je vizuální obsah klíčový, nám generativní AI nástroje jako Dall‑E a Midjourney otevírají nové možnosti. Náš kolega a e‑learning developer Brian používá tyto nástroje při své práci denně. Provedl tedy experiment, kdy nechal oba nástroje generovat sérii stejných promptů. V tomto článku se dozvíte, jak experiment dopadl, uvidíte přímo jeho výsledky a také se s vámi Brian podělí o praktické tipy, jak při tvorbě grafiky for e‑learning genAI nástroje využít. Pojďme tedy na to.


K čemu slouží Dall‑E a Midjourney?

Dall‑E a Midjourney jsou pokročilé AI nástroje navržené ke generování obrazového obsahu na základě textových popisů (promptů). Nacházejí uplatnění v mnoha oblastech, např. v grafickém designu, obsahovém marketingu, umění, ale i při tvorbě e‑learningu. Dall‑E, který je součástí prémiového plánu chatGPT od OpenAI, umožňuje uživatelům transformovat textové popisy na detailní obrázky a ilustrace. Na druhé straně, Midjourney je samostatná AI platforma, která nabízí několik verzí svého algoritmu (5.2, 6, Niji 6) s různými schopnostmi a specializacemi, a umožňuje tak uživatelům při tvorbě vizuálního obsahu experimentovat s různými styly a úrovněmi detailů.

Výhody a nevýhody Dall‑E a Midjourney

Dall‑E

Výhody

  • Stačí mu jednoduché prompty. 
  • Jednoduchá úprava už vytvořených obrázků pomocí gen_id picture #.

Nevýhody

  • Vytváří maximálně 2 obrázky současně.
  • Nechce vytvářet věci, které by mohly spadat pod copyright.
  • Má limit 40 promptů za 3 hodiny a do toho se počítají i prompty z GPT4 (toto platí pro plán Plus).
  • Neumí pracovat s obrázky jako prompty.
  • Neumí negative prompting.


Midjourney

Výhody

  • Umí pracovat s obrázky jako prompty.
  • Pro každý prompt vytvoří 4 obrázky.
  • Neřeší copyright, vytváří i postavy z her, filmů a podobně.
  • S basic plánem lze vytvořit kolem 200 obrázků měsíčně.
  • Umí blend několika obrázků v jeden.
  • Umí multi‑prompting (víc promptů s tím, že každý má svojí vlastní váhu).
  • Umí negative prompting.
  • Je rychlejší, zvládne 4 obrázky za minutu.
  • Umí dělat několik obrázků zároveň (záleží na plánu, který platíte).
  • Víc možností, jak upravovat obrázek (např. vary region, vary subtle, vary strong) 
  • Verze 6 výrazně lépe pracuje s textem v obrázcích.
  • Generování obrázků probíhá skrze komunikační platformu Discord, kde je velmi aktivní a nápomocná komunita.
  • Možnost přetvořit reálnou osobu do konkrétního vizuálního stylu (např. toto jsou verze Briana ve stylu Pixar animace).


Nevýhody

  • Je potřeba se naučit pořádně promptovat a používat parametry, jinak to bude mít svojí hlavu.
  • U verze 6 je potřeba vypsat co nejvíce detailů.

Protože ve světě AI se věci mění doslova každým dnem, v době mezi experimentem a napsáním tohoto článku vyšel nový update Midjourney, jehož součástí jsou také rozšířené parametry pro vytvoření postav. Tento update není v článku zohledněn. Momentálně ho ale prozkoumáváme.


Výsledky experimentu s Dall-E a Midjurney


Co to znamená pro e‑learning?

Ačkoliv by se podle výhod a nevýhod mohlo zdát, že Midjourney jednoznačně vede, při tvorbě e‑learningu pro nás mají oba nástroje podobnou hodnotu. Dall‑E jsme se naučili integrovat do samotných kurzů a máme tak možnost generovat obrázky přímo v nich, což je obrovská výhoda. Jak to funguje se můžete sami podívat v našem prototypu.

Díky jednoduché úpravě už vytvořených obrázků si Dall‑E dobře vede při tvorbě e‑kurzů, ve kterých jsou konzistentní postavy a avataři, kteří studující kurzem provádí, a je potřeba mít je vyobrazené v mnoha různých kontextech.

Kvůli jeho propojení s chatGPT4 je však nevýhoda v tom, že po dobu generování obrázků (což může být při tvorbě e‑learningu i proces na několik hodin), není možné využívat chatGPT4 k dalším úkolům. Navíc, do limitu 40 promptů na 3 hodiny spadají jak prompty z chatGPT4 tak prompty z Dall‑E. To znamená, že pokud při generování obrázků překročíte 40 promptů, GPT4 si vyblokujete i na několik dalších hodin po dokončení tvorby obrázků. 

Když ke generování obrázků použijete Midjourney, nijak to neomezí funkčnost GPT4 a celý proces je navíc rychlejší, protože Midjourney dokáže generovat víc obrázků současně za použití více promptů najednou. Počet procesů ale záleží na tom, jaký plán máte.

Přehled jednotlivých plánů

Co se týče Brianových osobních preferencí, pracuje raději s Midjourney, protože je to pro něj díky četnějším funkcím a širším možnostem zábavnější. Dall-E a jeho možnost používat jednodušší prompty ale rád využívá k brainstormingu. Když měl například do jednoho kurzu vytvořit obrázky týkající se tématu digitálního well‑beingu a nenapadlo ho, jak to pojmout, Dall‑E mu pomohl s nápadem a v Midjourney, kde je potřeba použít detailní prompt, pak podle tohoto nápadu vytvořil konkrétní obrázek.

Závěr

Co si z toho tedy odnést? Oba nástroje mají při tvorbě grafiky do e‑learningových kurzů své uplatnění a nelze proto jednoznačně říct, že jeden je pro tento typ tvorby lepší, než druhý. Nejlepších výsledků dosáhnete experimentováním a kombinací obou nástrojů. 

UPOZORNĚNÍ: Nejsme experti na generativní AI nástroje a všechny informace a tipy sdílené v článku vychází z pouze našich vlastních zkušeností s používáním těchto nástrojů v praxi při tvorbě e‑learningových kurzů.

Petr Glaser 🤖

Code smarter with AI: Boost your team's efficiency | Transform your coding approach | Experience brilliance today 🔥

8 měs.

Základ fajn, Midjourney prostě vede, ale... 1. Dall-E jde používat i bez ChatGPT (a tím neřešit limit). Ať už přímo přes API nebo třeba přes Bing Create. Nebo Copilota. 2. Prompt, který napíšete do ChatGPT, není ten, co se pošle do Dall-E. ChatGPT mění ten prompt, což si můžete ověřit rozkliknutím obrázku - uvidíte skutečný prompt. 3. I Midjourney už by mělo mít API a webové rozhraní. Myslím, že to je podmíněno počtem už vygenerovaných obrázků. 4. Můžete použít ChatGPT k tomu, aby popsala obrázek tak, aby ho mohla AI vytvořit. To pak lze použít jako prompt pro tvorbu. Nebo jeho části. :)

Chcete-li zobrazit nebo přidat komentář, přihlaste se