„Viggle“ sukuria valdomus AI simbolius memams ir idėjų vizualizavimui
Galbūt nežinote „Viggle AI“, bet tikriausiai matėte jos sukurtus virusinius memus. Kanados AI startuolis yra atsakingas už dešimtis vaizdo įrašų, kuriuose remiksuoja reperis Lil Yachty, šokinėjantis ant scenos vasaros muzikos festivalyje. Viename vaizdo įraše Lil Yachty pakeičiamas Joaquino „Phoenix's the Joker“. Kitame, Jėzus atrodė sujaudinęs minią. Vartotojai sukūrė daugybę šio vaizdo įrašo versijų, tačiau vienas AI paleidimas kurstė memus. „Viggle“ generalinis direktorius sako, kad „YouTube“ vaizdo įrašai skatina dirbtinio intelekto modelius.
„Viggle“ išmokė 3D vaizdo pagrindo modelį JST-1, kad „tikras fizikos supratimas“, kaip teigia bendrovė savo pranešime spaudai. „Viggle“ generalinis direktorius Hang Chu sako, kad pagrindinis skirtumas tarp „Viggle“ ir kitų AI vaizdo modelių yra tas, kad „Viggle“ leidžia vartotojams nurodyti judesį, kurį jie nori, kad veikėjai imtųsi. Kiti AI vaizdo modeliai dažnai sukuria nerealius veikėjų judesius, kurie neatitinka fizikos dėsnių, tačiau Chu teigia, kad Viggle modeliai skiriasi.
„Iš esmės kuriame naujo tipo grafikos variklį, bet tik su neuroniniais tinklais“, – interviu sakė Chu. „Pats modelis labai skiriasi nuo esamų vaizdo generatorių, kurie daugiausia yra pagrįsti pikseliais, ir nelabai supranta fizikos struktūrą ir savybes. Mūsų modelis sukurtas taip, kad suprastų, todėl jis buvo žymiai geresnis valdomumo ir generavimo efektyvumo požiūriu.
Pavyzdžiui, norėdami sukurti Džokerio, kaip Lil Yachty, vaizdo įrašą, tiesiog įkelkite originalų vaizdo įrašą (Lil Yachty šoka ant scenos) ir veikėjo (Džokerio) atvaizdą, kad imtųsi to judesio. Arba vartotojai gali įkelti simbolių vaizdus kartu su tekstiniais raginimais su instrukcijomis, kaip juos animuoti. Kaip trečioji parinktis, „Viggle“ leidžia vartotojams kurti animuotus personažus nuo nulio naudojant vien tekstinius raginimus.
Tačiau memai yra tik mažas procentas Viggle vartotojų; Chu sako, kad modelis buvo plačiai pritaikytas kaip vizualizavimo įrankis kūrybiniams kūrėjams. Vaizdo įrašai toli gražu nėra tobuli – jie dreba, o veidai be išraiškos, tačiau Chu teigia, kad filmų kūrėjams, animatoriams ir vaizdo žaidimų dizaineriams pasirodė efektyvu paversti savo idėjas kažkuo vizualiu. Šiuo metu „Viggle“ modeliai kuria tik personažus, tačiau Chu tikisi vėliau sukurti sudėtingesnius vaizdo įrašus.
Šiuo metu „Viggle“ siūlo nemokamą ribotą savo AI modelio versiją „Discord“ ir žiniatinklio programoje. Bendrovė taip pat siūlo 9,99 USD prenumeratą, kad padidintų talpą, o kai kuriems kūrėjams suteikia specialią prieigą per kūrėjų programą. Generalinis direktorius sako, kad „Viggle“ kalbasi su filmų ir vaizdo žaidimų studijomis apie technologijos licencijavimą, tačiau jis taip pat mato, kad tai bus pritaikyta tarp nepriklausomų animatorių ir turinio kūrėjų.
Pirmadienį „Viggle“ paskelbė, kad surinko 19 milijonų dolerių A seriją, kurią vedė Andreessenas Horowitzas, dalyvaujant „Two Small Fish“. Startuolis teigia, kad šis raundas padės „Viggle“ išplėsti, paspartins produkto kūrimą ir išplės savo komandą. „Viggle“ praneša „TechCrunch“, kad bendradarbiauja su „Google Cloud“ ir kitais debesų tiekėjais, kad galėtų mokyti ir valdyti savo AI modelius. Šios „Google Cloud“ partnerystės dažnai apima prieigą prie GPU ir TPU grupių, bet paprastai ne „YouTube“ vaizdo įrašų, skirtų dirbtinio intelekto modeliams mokyti.
Treniruočių duomenys
TechCrunch interviu su Chu metu paklausėme, kokiais duomenimis buvo mokomi Viggle AI vaizdo modeliai.
„Iki šiol rėmėmės duomenimis, kurie buvo viešai prieinami“, – sakė Chu, perteikdamas panašią eilutę į OpenAI CTO Mira Murati atsakymą apie Soros mokymo duomenis.
Paklaustas, ar Viggle mokymo duomenų rinkinyje yra „YouTube“ vaizdo įrašų, Chu atsakė aiškiai: „Taip“.
Tai gali būti problema. Balandžio mėnesį „YouTube“ generalinis direktorius Nealas Mohanas „Bloomberg“ sakė, kad „YouTube“ vaizdo įrašų naudojimas mokant dirbtinio intelekto teksto į vaizdo įrašą generatorių būtų „aiškus“ platformos paslaugų teikimo sąlygų pažeidimas. Komentarai buvo susiję su „OpenAI“, galbūt panaudojusiu „YouTube“ vaizdo įrašus Sorai mokyti.
Mohanas paaiškino, kad „Google“, kuriai priklauso „YouTube“, gali sudaryti sutartis su tam tikrais kūrėjais dėl jų vaizdo įrašų naudojimo „Google DeepMind's Gemini“ mokymo duomenų rinkiniuose. Tačiau pagal Mohano ir „YouTube“ paslaugų teikimo sąlygas vaizdo įrašų rinkimas iš platformos neleidžiamas, negavus išankstinio bendrovės leidimo.
Po „TechCrunch“ interviu su „Viggle“ generaliniu direktoriumi, „Viggle“ atstovas el. paštu atsisakė Chu pareiškimo ir pasakė, kad „TechCrunch“ generalinis direktorius „per anksti kalbėjo apie tai, ar Viggle naudoja „YouTube“ duomenis kaip mokymą. Tiesą sakant, „Hang / Viggle“ negali pasidalinti išsamios informacijos apie savo treniruočių duomenis.
Nurodėme, kad Chu tai jau padarė įraše, ir paprašėme aiškaus pareiškimo šiuo klausimu. „Viggle“ atstovas spaudai patvirtino savo atsakyme, kad dirbtinio intelekto startuolis treniruojasi „YouTube“ vaizdo įrašuose:
„Viggle“ naudoja įvairius viešuosius šaltinius, įskaitant „YouTube“, kurdama AI turinį. Mūsų mokymo duomenys buvo kruopščiai kuruojami ir patobulinti, užtikrinant, kad viso proceso metu būtų laikomasi visų paslaugų teikimo sąlygų. Mes teikiame pirmenybę tvirtiems ryšiams su tokiomis platformomis kaip „YouTube“ ir esame įsipareigoję gerbti jų sąlygas, vengdami didelio atsisiuntimo kiekio ir bet kokių kitų veiksmų, susijusių su neteisėtu vaizdo įrašų atsisiuntimu.
Atrodo, kad toks požiūris į atitiktį prieštarauja Mohano komentarams balandžio mėnesį, kad „YouTube“ vaizdo įrašų korpusas nėra viešas šaltinis. Susisiekėme su „YouTube“ ir „Google“ atstovais, bet dar negirdėjome.
Paleistis prisijungia prie kitų pilkoje srityje ir naudoja „YouTube“ kaip mokymo duomenis. Buvo pranešta, kad daugelis AI modelių kūrėjų, įskaitant „OpenAI“, „Nvidia“, „Apple“ ir „Anthropic“, visi naudoja „YouTube“ vaizdo įrašų transkripcijas arba klipus mokymams. Tai nešvari paslaptis Silicio slėnyje, kuri nėra tokia slapta: tikriausiai visi tai daro. Iš tikrųjų reta yra tai pasakyti garsiai.