Paano Binabago ng Gemini Omni ang mga Video Ad
Malapit nang matapos ang panahon ng paggawa ng kaunting video ad at pagpapahaba ng mga ito nang ilang linggo.
Sa Google I/O, ipinakilala ng Google ang Gemini Omni, isang multimodal AI model na idinisenyo upang gumana sa teksto, mga imahe, audio, at video nang sabay-sabay. Ito ay nakaposisyon bilang isang pagbabago sa kung paano ginagawa at sinusubukan ang malikhaing nilalaman.
Sa halip na bumuo ng mga patalastas nang paunti-unti, script muna, pagkatapos ay visual, at pagkatapos ay pag-eedit, maaari na ngayong magtrabaho ang mga pangkat mula sa pinaghalong input nang sabay-sabay. Ang isang demo ng produkto, isang patalastas ng kakumpitensya, at isang maikling brief ay maaaring pagsamahin sa isang sistema na nakakaintindi sa buong konteksto at nakakabuo ng output nang naaayon.
Ganoon ito ipinakikilala.
Ang mahalaga ay kung paano ito gagana sa pagsasagawa.
Ang problema
As Demis Hassabis ay itinuro sa konteksto ng mga mas bagong sistema ng AI, ang layunin ay upang madaling mapunan ang agwat sa pagitan ng intensyon at output.
Parang abstrak ang ideyang iyan hangga't hindi mo tinitingnan kung paano talaga nangyayari ang malikhaing gawain.
Sa pagsasagawa, ang karamihan sa paghina ay nagmumula sa paggawa ng pisikal na realidad na pag-iisip na iyon tungo sa isang bagay na magagamit.
Mayroon tayong direksyon at malinaw na mensahe. Ngunit ang pagpunta mula sa puntong iyon patungo sa isang natapos na piraso ay nangangailangan pa rin ng maraming hakbang: briefing, produksyon, mga rebisyon, at mga pag-apruba. Ang bawat hakbang ay nagdaragdag ng oras, at ang pagkaantala ay nagpapalala.
Sa oras na handa na ang isang bagay, kadalasan ay nagbabago na ang konteksto sa paligid nito.
Kaya Ano nga ba ang Gemini Omni?
Binabago ng Gemini Omni ang paraan ng paghawak ng mga input.
Karamihan sa mga malikhaing daloy ng trabaho ay linear. Magsisimula ka sa isang script, pagkatapos ay bubuo ng mga visual na kaugnay nito, pagkatapos ay isaayos ang tono sa pag-eedit. Ang bawat hakbang ay nakadepende sa nauna. Kung may mali, babalik ka at aayusin ito.
Pinapaliit ng Gemini Omni ang prosesong iyon.
Dahil kaya nitong iproseso ang maraming format nang sabay-sabay, hindi nito kailangang isalin muna ang lahat sa teksto. Maaaring mag-upload ang isang team ng:
- Isang video ng gabay sa produkto
- Dalawang ad na may mataas na performance mula sa mga kakumpitensya
- Ilang tala tungkol sa madla at tono
At ang modelo ay gumagana sa lahat ng ito nang sabay-sabay.
Lumilikha ito ng mga output na sumasalamin sa mga ugnayan sa pagitan ng mga input na iyon.
Madaling makaligtaan ang pagkakaibang iyan hangga't hindi mo sinusubukang magbigay ng maikling impormasyon gamit ang isang tradisyonal na AI tool. Ang pagsulat ng isang prompt na kumukuha ng tono, bilis, biswal na istilo, at emosyonal na layunin ay mas mahirap kaysa sa inaakala. Karamihan sa mga prompt ay nauuwi sa alinman sa masyadong malabo o masyadong mahigpit.
Dito, ang input ay nagdadala ng mas maraming kahulugan.
Veo 3.1: Ang Video Engine sa Likod ng Gemini Omni
Ang Gemini Omni ay nakapatong sa isang mas malawak na sistemang binuo ng Google DeepMind.
Isa sa mga pangunahing sangkap ay Veo 3, isang modelo ng pagbuo ng video na tumutugon sa praktikal na limitasyon na mayroon ang karamihan sa mga naunang kagamitan: kakulangan ng katutubong audio.
Mas mahalaga ang detalyeng iyon kaysa sa tila.
Kung nasubukan mo na ang mga silent video ads, alam mo na ang resulta. Kahit may mga caption pa, nahihirapan pa rin itong makuha ang atensyon. May dala ang audio ng pacing at emosyonal na mga pahiwatig na hindi kayang gawin ng mga visual lamang.
Ang Veo ay bumubuo ng parehong video at audio nang magkasama. Nagbibigay-daan din ito para sa mas nakabalangkas na kontrol. Sa halip na magbigay ng iisang prompt at umasa sa pinakamahusay, maaari mong tukuyin ang mga bahagi ng sequence:
- kung paano nagsisimula ang eksena
- ano ang mangyayari sa kalagitnaan
- kung paano natutukoy ang mensahe
Halimbawa, maaari mong tukuyin na sa loob ng unang tatlong segundo, direktang tutugunan ng paksa ang isang karaniwang problema. Sa loob ng limang segundo, ipinakikilala ang produkto. Sa huli, ipinapahayag ang panawagan para sa aksyon.
Ang antas ng kontrol na iyon ay mas naaayon sa kung paano aktwal na binubuo ang mga performance ad.
Pinag-uugnay ng Gemini Omni ang mga kakayahang ito sa isang reasoning layer. Tinitiyak nito na ang iba't ibang bahagi ng output, visuals, audio, at timing ay magkakasamang nagtutulungan sa halip na parang pinagsama-sama.
Paano Binabago ng Gemini Omni ang Daloy ng Trabaho sa Video Ad
Mas Mabilis ang Pagbibigay ng Briefing Dahil Mas Mahusay ang Paglalakbay ng Konteksto
Sa ngayon, nagbibigay ng impormasyon sa isang Kagamitang AI para sa mga video ad magulo. Gumagawa ka ng mahabang text prompt na nagpapaliwanag kung ano ang produkto, ano ang nararamdaman ng mga tagapakinig, ano ang dapat na biswal na istilo, at ano ang dapat na anggulo ng pagkahumaling. Marami kang ginagawa sa pagsasalin.
Sa Gemini Omni, maaaring kasama sa iyong brief ang isang reference video, larawan ng produkto, at teksto. Itinuturing ito ng modelo bilang isang input lamang. Hindi mo na kailangang ilarawan ang vibe gamit ang mga salita. Ipinapakita mo lang ito.
Nagiging Praktikal ang Pagbabago-bago ng Iskrip sa Malaking Sukat
Narito ang isang totoong gamit. Sabihin nating nagbebenta ka ng isang produktong pang-skincare. Gusto mong subukan ang limang magkakaibang hook: isang problem hook, isang testimonial hook, isang comparison hook, isang results hook, at isang curiosity hook. Ang bawat isa ay nangangailangan ng bahagyang magkakaibang script, magkakaibang panimulang linya, at magkakaibang CTA.
Gamit ang Gemini Omni na hahawak sa brief, makakabuo ka ng limang script na iyon na nakahanda na ang konteksto ng produkto. Makakakuha ka ng mga script na nakakaalam ng produkto, nakakaalam ng format, at nakakakilala sa audience dahil ipinakita mo ang lahat ng iyon nang patiuna.
Malaking Pag-upgrade ang mga Ad na Istilo ng UGC
Gumagana ang mga UGC video ad dahil parang totoo ang pakiramdam. Ang hamon ay ang paggawa ng sapat na dami ng mga ito nang hindi nauubos ang badyet ng iyong creator o naghihintay ng tatlong linggo para sa paghahatid.
Ang kakayahan ng Gemini Omni na iproseso ang video bilang input ay nangangahulugan na maaari mong suriin kung ano ang gumagana sa iyong kasalukuyang UGC library at gamitin iyon upang mas tumpak na mag-brief ng mga bagong nilalaman. Aling mga hook ang napupunta? Anong pacing ang gumagana? Anong visual na istruktura ang nagtutulak sa pagpapanatili?
Ilalabas mo ang pattern na iyan, bibigyan ng mga briefing ang mga bagong creator, at mas matatalinong variation ang sinusubukan mo, hindi lang ang mas maraming variation.
Para sa mga brand kung saan ang UGC ay isang pangunahing format ng ad, isa itong makabuluhang bentahe sa produksyon.
Ang Malikhaing Pagsubok ay Nakakuha ng Layer ng Istratehiya
Karamihan sa mga malikhaing pagsubok ay reaktibo. Sinusubukan mo ang iyong ginawa. Natututunan mo kung ano ang gumana. Sinusubukan mong gawin pa ito.
Ipinakikilala ng Gemini Omni ang posibilidad ng proactive testing. Maaari kang magmodelo ng mga hypotheses bago ka gumawa. Maaari mong suriin ang konsepto ng isang ad at tanungin ang modelo kung aling mga variable ang malamang na makakaapekto sa performance, batay sa istruktura, uri ng hook, at message framing. Hindi mo pinapalitan ang pagsubok ng prediksyon. Pinakikitid mo ang iyong testing surface sa mga bagay na malamang na mahalaga.
Iyan ay isang malikhaing pagbabago sa estratehiya. Magkakaiba ang paggamit nito ng maliliit at malalaki na brand.
Ang Napagkakamalan ng Karamihan sa mga Tao Tungkol sa AI sa Marketing
Itinuturing nila ang AI bilang isang makinang pang-content sa halip na isang katuwang sa pag-iisip.
Ang tanong ng karamihan sa mga marketer ay โilang ad ang kaya nitong malikha?โ Ang mas magandang tanong ay โpaano nito natutulungan akong mag-isip tungkol sa mga ad nang iba?โ
Tunay na kapaki-pakinabang ang Gemini Omni para sa bilis ng produksyon. Ngunit ang mas malaking halaga nito ay nasa yugto ng pananaliksik at estratehiya: pagsusuri kung ano ang gumagana, pag-unawa sa mga malikhaing pattern, pagbuo ng mga hypotheses, at paggawa ng mga nakabalangkas na brief na humahantong sa mas mahusay na output mula sa parehong mga tool ng AI at mga tagalikha ng tao.
Kung ilalagay mo ito sa isang sirang proseso ng paglikha, mas mabilis ka lang makakagawa ng mas maraming karaniwang nilalaman. Hindi iyon ang layunin.
Ang mga nauuna nang tatak ay gumagamit muna ng AI upang hasain ang kanilang malikhaing pag-iisip, pagkatapos ay ginagamit ito upang mapabilis ang produksyon.
Konklusyon
Hindi mapapalitan ng Gemini Omni ang iyong malikhaing pagpapasya. Hindi dapat ganoon.
Ang ginagawa nito ay binabawasan ang agwat sa pagitan ng pagkakaroon ng isang magandang ideya at pagkakaroon ng isang nasusubukan. Para sa karamihan ng mga marketing team, ang agwat na iyon ang dahilan kung bakit nawawala ang oras, badyet, at momentum.
Ang mga marketer na seryoso rito ay magmumukhang mayroon silang hindi pangkaraniwang mahusay na malikhaing output at hindi pangkaraniwang mabilis na feedback loops.
Iyan ang tunay na kalamangan sa kompetisyon dito. Hindi ang teknolohiya. Ang ginagawa mo sa oras na ibinabalik nito sa iyo.
Mga Madalas Itanong
Ang Gemini Omni ay ang bagong modelo ng AI ng Google na pinagsasama ang mga kakayahan sa pangangatwiran at mga tool sa paglikha ng media upang makabuo at mag-edit ng nilalaman sa iba't ibang format. Ang unang paglabas ay nakatuon sa video. Pinapakain mo ito ng teksto, mga imahe, audio, o umiiral na video, at naglalabas ito ng video na nangangatuwiran sa lahat ng input na iyon nang magkakasama sa halip na iproseso ang mga ito nang hiwalay.
Ang Veo 3.1 ang video generation engine. Ito ang humahawak sa aktwal na rendering, audio, visual fidelity, at format output. Ang Gemini Omni naman ang reasoning layer sa itaas. Nauunawaan nito ang konteksto, maikling layunin, at malikhaing direksyon, pagkatapos ay ginagamit ang kakayahan ng Veo sa pagbuo upang makagawa ng output na sumasalamin sa pag-unawang iyon. Magkasama, sila ang pinakamahuhusay na AI video stack na ipinadala ng Google sa publiko.
Magagamit na ngayon ang Gemini Omni Flash sa Gemini app, Google Flow, at YouTube Shorts. Ilalabas ito sa Google Ads ngayong tag-init. Naging malinaw ang Google na may mas malalaking update sa Omni na darating sa huling bahagi ng taong ito, ibig sabihin ang kasalukuyang paglabas ay isang maaga at mabilis na variant, hindi ang buong kakayahan sa world-model na inilarawan ni Hassabis.
Ginagawa nitong mas mabilis ang briefing, mas mura ang iteration, at mas makatotohanan ang dami ng variation para sa mga lean team. Kapag pinagsama mo ang AI video generation sa antas ng modelo na may mga purpose-built na UGC ad platform tulad ng Tagshop.ai, ang buong siklo ng produksyon mula sa URL ng produkto hanggang sa nai-publish na ad ay tumatagal mula linggo hanggang oras.
Oo. Ang mga pangkat na gumagamit na ng mga tool ng AI UGC ay bumubuo ng anim hanggang pitong video araw-araw sa mas mababang halaga kumpara sa tradisyonal na gastos sa produksyon. Itinataas ng Gemini Omni ang limitasyon sa kalidad ng maaaring hitsura at tunog ng video na nabuo ng AI. Ang mga brand na nagsasama ng creative testing sa kanilang workflow ngayon ay magkakaroon ng malaking kalamangan habang bumubuti ang mga tool sa susunod na 12 buwan.