Náhledový obrázek článku Top AI nástroje, ktoré môžete používať v svojom počítači (text, obrázky, audio, video)

Top AI nástroje, ktoré môžete používať v svojom počítači (text, obrázky, audio, video)

Profilový obrázek uživatele Gargyy Marek "Gargyy" Galierik
30. 4. 2024, 8:15 | Dokonalý pomocník

Autorom článku je Martin Smatana.

Za posledný rok som vyskúšal približne 130 nástrojov a aplikácií využívajúcich umelú inteligenciu. Do tohto článku som vybral niekoľko z nich, ktoré ja sám najčastejšie používam, a rozdelil som ich do pomyselných štyroch kategórií podľa oblasti. Niektoré aplikácie sú zadarmo, iné sú zdarma iba na nejaký čas a niektoré sú platené, väčšinou v rozmedzí od 5 do 30 € mesačne.

1. TEXT

Práca s textom v umelej inteligencií znamená, že užívateľ napíše programu nejaký TEXT (napríklad príkaz alebo otázku) a program mu vráti odpoveď tiež vo forme textu. Tento proces sa preto nazýva text-to-text a je to veľmi podobný tomu, ako keď si s niekým chatujeme. Preto sa tieto programy inak označujú aj ako Chatboty, alebo veľké jazykové modely. Označujú sa tak preto, že na internete majú prístup k takmer neobmedzenej databáze informácií, ktoré dokážu vyhodnocovať a vybrať štatisticky najpravdepodobnejšiu odpoveď.

Štyri jazykové modely, ktoré pri svojej práci najčastejšie používam, sú ChatGPT od firmy Open AI, Gemini od Google, Copilot od Microsoftu a Claude od Anthropicu.

Každý z nich má iné silné stránky a každý je dobrý na iný typ úloh. Ak by som napríklad potreboval odpoveď podloženú linkom na zdroj, nehľadal by som ju na ChatGPT, ale zrejme na Copilote alebo Perplexity. Ak by som napríklad potreboval vygenerovať text dlhý niekoľko strán, alebo aj desiatok strán, najvhodnejší nástroj je Claude.

Zdroj: Anthropic

To, ktorý Chatbot by mohol byť pre vás najlepším osobným asistentom zistíte jedine experimentovaním, skúšaním a pozeraním tutoriálov. 
A nemusí to byť iba jeden z nich. Ja sám ich častokrát používam tak, že ak rieším nejaký komplexný problém, otvorím si v rámci jedného prehliadača každú túto aplikáciu na samostatnej karte, položím im tú istú otázku a na základe viacerých odpovedí si urobím sám záver.

Všetky z týchto Chatbotov dnes dokážu odpovedať nielen v angličtine, ale už pohodlne aj v slovenčine, pričom samozrejme naďalej platí bez ohľadu na jazyk, že ich odpovede, tak ako všetko vo svete, je potrebné preveriť a mali by podliehať nášmu kritickému mysleniu.

To, ktorý Chatbot by mohol byť pre vás najlepším osobným asistentom zistíte jedine experimentovaním, skúšaním a pozeraním tutoriálov.

Každý z nich má svoju bezplatnú aj platenú verziu, ktorá stojí 20 € mesačne. Bezplatná verzia má zvyčajne nejaké obmedzenie, napríklad že má informácie len do nejakého konkrétneho dátumu, alebo vygeneruje odpoveď len v určitej dĺžke, alebo sa nedá ovládať hlasom, alebo nevie spracovať obrázky.


Notion

Umelá inteligencia je dnes už implementovaná aj do programov, ktoré ju v sebe ešte donedávna nemali. Jedným z nich je napríklad Notion, čo je program na prácu s dátami a databázami. Je to program, ktorý už niekoľko rokov používam dennodenne pri všetkých projektoch, ktoré robím. Keď pripravujem film, vediem si v ňom databázu záberov, aby som vedel, ktorý animátor má animovať ktoré zábery. Keď som pripravoval moje ilustrované knižky, všetky dobré správy som si sumarizoval v Notion.

Spravujem v ňom prehľad rozpočtov a financií na konkrétne projekty, kde ich môžem efektívne kategorizovať. Nedávno Notion implementoval do svojho užívateľského rozhrania umelú inteligenciu, vďaka ktorej teraz dokážem z týchto dát pohodlne vytiahnuť nejakú informáciu a použiť ju ako vstupný input pre príkaz, čo mi šetrí enormné množstvo času.

Zdroj: Notion


2. OBRÁZKY

Druhou oblasťou, v ktorej má umelá inteligencia obrovský potenciál je práca s obrázkami.
Práca s obrázkami by sa dala rozdeliť do dvoch krokov - prvým je generovanie obrázkov, čo znamená, že ja dám nejakému programu príkaz v textovej podobe a on mi ho vráti vo forme obrázku. Tento postup sa nazýva aj text-to-image. A druhým krokom je ich úprava, na ktorú je umelá inteligencia výborným pomocníkom.

Na generovanie a úpravu obrázkov existujú dnes už stovky nástrojov a aplikácií. Štyri, ktoré najčastejšie používam ja, sú Dall-E, Midjourney, Magnific a Photoshop.


Dall-E

Ak niekto pracuje primárne s vizuálnymi materiálmi, určite odporúčam si každý z nich vyskúšať, pretože každý z nich je dobrý na iný typ činnosti. Závisí to aj od toho, na aký účel sa užívateľ chystá obrázok použiť - obrázok môže byť buď finálnym výstupom, alebo iba akýmsi medziproduktom, ktorý ma má ako tvorcu napríklad inšpirovať vo výrobe niečoho väčšieho. Ak potrebujete napríklad obrázok, ktorý nemusí byť hyperrealistický, napríklad nejakú schému, grafiku, storyboard, dobrým nástrojom je Dall-E, okrem iného aj preto že je súčasťou ChatGPT.

Ak niekto pracuje primárne s vizuálnymi materiálmi, určite odporúčam si každý z nich vyskúšať, pretože každý z nich je dobrý na iný typ činnosti.

Jeho obrovskou výhodou je, že je integrovaný do prostredia ChatGPT v rovnakom okne, do ktorého píšete textové príkazy. Jediné, čím musím špecifikovať, že výstup má byť obrázok je to, že mu napíšem príkaz “Vygeneruj mi obrázok, napríklad Dizajnový vektorový plagát v retro štýle na výšku zobrazujúci cestu rakety na Mars.”

Niekedy ale možno presne neviem, ako napísať ten správny príkaz, aby som dostal želaný obrázok. V takom prípade môžem poprosiť ChatGPT, aby mi vygeneroval sériu príkazov, ktoré môžem následne zadať obrázkovému generátoru. Môžem mu preto napísať príkaz “Rád by som vygeneroval obrázok mesta postaveného z ovocia a zeleniny. Vytvor mi 5 rôznych promptov v angličtine, ktoré môžem použiť pre generovanie.” ChatGPT mi napíše správne naformulované príkazy, ktoré by som tak zrejme sám nikdy nenapísal.

Zdroj: IG@martin.smatana


Midjourney

Ak potrebujete naopak veľmi realistické výstupy s krásnym osvetlením, tieňmi a materiálmi, najlepším nástrojom aktuálne na trhu je rozhodne Midjourney, ktorý má ale zase celú sériu nevýhod - okrem toho, že je zďaleka najdrahší, môže začiatočníkom pripadať jeho užívateľské prostredie neprehľadné a chaotické.

Midjourney totiž beží na serveri, ku ktorému sa užívateľ pripája cez program Discord. Výhodou bytia v takejto verejnej otvorenej miestnosti je to, že vidíte, aké príkazy ľudia používajú, aby dosiahli konkrétny vzhľad, vďaka čomu sa o promptovaní môžete veľa naučiť.

Nevýhodou je, že každých pár sekúnd sa plocha pohybuje, čím sa prostredie stáva veľmi chaotické a váš obrázok sa medzi ostatnými ľahko stratí. Oveľa výhodnejšie je preto vytvoriť si neskôr vlastný server a miestnosť, v ktorej ste len vy sami a môžete sa sústrediť na vlastné generovanie.

Generovať cez Midjourney môžete aj priamo na ich oficiálnej stránke vo webovom prehliadači, avšak až v čase, kedy máte cez Discod vygenerovaných minimálne 1.000 obrázkov.

Zdroj: Midjourney

Napriek všetkým týmto nevýhodám si myslím, že Midjourney je neskutočne silný nástroj, ktorý sa dá využiť na reklamu, webový dizajn, sociálne média, marketingové kampane, ilustrácie pre knihy, produktové alebo architektonické vizualizácie, prezentácie, branding či herný priemysel.

Ja sám som ho v minulosti použil na viacero komerčných zákaziek. Pre marcové číslo magazínu Forbes som vytvoril portréty dvanástich slovenských changemakerov, ktorí menia Slovensko k lepšiemu. S jednou zahraničnou reklamnou agentúrou aktuálne pripravujeme animovanú reklamu pre módnu značku, v ktorej sa pokúšam rozpohybovať domy pokryté chlpatými huňatými materiálmi či veľkými závojmi. S istou outdoorovou značkou spolupracujeme na ich reklame, v ktorej sú budú horské chaty vyrobené zo spacákov, stanov, a outdoorových odolných materiálov.

Zdroj: screenshot Forbes.sk


Úprava obrázkov

Na úpravu obrázkov používam starý dobrý Photoshop od Adobe, v ktorom sa vďaka umelej inteligencií dajú dnes obrázky retušovať a upravovať doslova jedným klikom. Vďaka generatívnej umelej inteligencií môžeme obrázky vo Photoshope nielen upravovať, ale dokonca aj vytvárať.

Druhým skvelým pomocníkom pri úprave obrázkov je Magnific AI, ktorý slúži na kreatívne zväčšenie obrázkov. Ak máte náhodou fotky v malej kvalite a v nízkom rozlíšení, môžete použiť tento skvelý nástroj využívajúci umelú inteligenciu na dopočítanie chýbajúcich pixelov.

Tieto nástroje môžu byť veľmi nápomocné aj pri tvorbe filmov. Dnes je možné už vygenerovať jednotlivé zábery filmu vo forme statických obrázkov (to si samozrejme vyžaduje už istú mieru znalosti práce s parametrami, aby sa mi darilo udržať nejakú konzistenciu v zmysle štýlu a postáv) a následne ich rozpohybovať cez ďalšie programy. Týmto spôsobom som si vyskúšal vytvoriť trailer budúceho krátkeho filmu.

Zdroj: smatana.com


3. VIDEO

Práca s videom v umelej inteligencii bude hlavná téma v nasledujúcich mesiacoch, a najmä druhá polovica roka 2024 bude v zmysle umelej inteligencie patriť práve generovaniu videa. Práca s videom v umelej inteligencii znamená, že do nejakej stránky môžem vložiť buď text, na základe ktorého mi AI vygeneruje video - taký postup sa volá text-to-video, alebo ako vstupné dáta použijem namiesto textu obrázok - taký postup sa volá image-to-video. Tri najznámejšie nástroje na prácu s AI videom sú Runway, Pika a Sora.

Práca s videom v umelej inteligencii bude hlavná téma v nasledujúcich mesiacoch, a najmä druhá polovica roka 2024 bude v zmysle umelej inteligencie patriť práve generovaniu videa. 

Celý postup funguje tak, že do aplikácie natiahnete obrázok, ktorý chcete rozpohybovať, napíšete, aká akcia sa má vo videu stať, nastavíte mieru všeobecného pohybu, pomocou brush toolu označíte oblasti, ktoré sa majú pohybovať, pričom v najnovšej verzii Runwayu máte k dispozícií až 5 samostatných brushov, pomocou posuvníku určite, do ktorého smeru sa má vybraná oblasť pohybovať, spustíte generáciu a o pár minút vám aplikácia vráti 4-sekundové video, ktoré môžete ďalej predĺžiť ďalším náväzným generovaním.

Veľký potenciál pri práci s AI videom vidím v tvorbe komerčných videí pre značky. Takto napríklad vznikla reklama pre Adidas.


Sora

Sora je dlhoočakávaný a nádejný videogenerátor, ktorý je už síce hotový, no verejne ešte nie je k dispozícií. V posledných mesiacoch bol zverený do rúk vedcov a etických hackerov, aby ho preskúšali a zamedzili možnej tvorbe budúcich video-deep-fakeov, najmä pred blížiacimi sa americkými voľbami.

Nedávno ho dostalo do rúk niekoľko vybraných umelcov, ktorí mali možnosť Soru otestovať a vytvoriť krátke filmy, napríklad Beyond Our Reality alebo Air Head. Podľa všetkého bude Sora k dispozícií verejnosti až na jeseň a videá, ktoré z nej budú vychádzať, budú už takmer na nerozoznanie od materiálu natočeného na kameru.


4. AUDIO

Predstavte si, že robíte nejaké video v ktorom potrebujete mať hovorené slovo alebo sprievodný komentár (propagačné či inštruktážne video, tutoriál, návod). Ak hovorený text z nejakého dôvodu nechcete alebo nemôžete nahrávať na mikrofón, môžete ho napísať v ľubovoľnom jazyku, otvoriť si nástroj ElevenLabs, vložiť do neho text  vybrať si hlas, ktorý má text nahovoriť, upraviť jeho parametre a intonáciu a nechať ElevenLabs tento text prečítať.

Aktuálne pracujem na animovanej reklame pre bratislavskú zubnú kliniku a Elevenlabs používam na generovanie doprovodného komentáru v rôznych jazykoch.

Zdroj: screenshot elevenlabs.io

Druhý nástroj sa volá Auphonic a dokáže upraviť zvuk z akejkoľvek nahrávky alebo videa tak, aby znel, akoby bol nahratý v profesionálnom zvukovom štúdiu. Auphonic je veľmi nápomocný pri nahrávaní rozhovorov, podcastov a reportáží v hlučnejšom prostredí, alebo pri čistení hudobných nahrávok.


Hodnocení článku:

Načítám diskuzi...