Hirdetés bezárása

A Google a közelmúltban mutatta be Gemini 2.0 alkalmazását, amely az előző verzióhoz képest számos új funkciót és lehetőséget kínál. A Gemini 2.0 másként dolgozza fel az információkat, mint elődje, és összetettebb feladatokat is meg tud oldani. Milyen konkrét híreket kínál?

Natív kép- és hangfeldolgozás

A Gemini 2.0 azonosítja az objektumokat a képen, és megérti azok kapcsolatait és a jelenet kontextusát. Ellentétben a korábbi modellekkel, amelyekben az elemzés előtt a képeket és a hangot szöveggé kellett konvertálni, a Gemini 2.0 közvetlenül feldolgozza azokat. A cél az átvitelhez kapcsolódó információvesztés kiküszöbölése. A közvetlen feldolgozás lehetővé teszi a bemeneti információk gazdagabb megértését, olyan részletek és kontextuális jelzések rögzítését, amelyek egyébként elvesznének a konverzió során. A Gemini 2.0 a multimédiás tartalmak pontosabb és hatékonyabb értelmezését ígéri a szövegátalakítás közbenső lépésének megkerülésével.

Gemini

Ügynök AI

A Gemini 2.0 többre képes kevesebbel. Az Agent AI kifejezés olyan mesterséges intelligencia modellekre utal, amelyek aktívan kölcsönhatásba lépnek a világgal meghatározott célok elérése érdekében. A Gemini 2.0 támogatja ezeket az AI-modelleket, lehetővé téve számukra, hogy olyan összetett, többlépcsős feladatokat hajtsanak végre, amelyek tervezést, döntéshozatalt és külső rendszerekkel való interakciót igényelnek. A Gemini 2.0 releváns képességei az, hogy integrálhatók olyan külső eszközökkel, mint a Google Search, a Maps és a Lens. Például a Gemini 2.0 AI ügynök a Google Maps segítségével összetett útvonalat tervezhet, amely több úti célt és közlekedési módot is magában foglal.

Az integráció elmélyítése a Google ökoszisztémájában

A Gemini 2.0-val a mesterséges intelligencia mindenhová eljut. A Gemini 2.0 mélyen integrálódik a Google termékeinek és szolgáltatásainak ökoszisztémájába. Az ígéret egy egységesebb és gördülékenyebb felhasználói élmény. A Gemini 2.0 kibővített integrációi rámutatnak a Google stratégiájára, miszerint a Geminit közös szálként használja, amely az egész Workspace-en végigfut. A Google Kereső egyre mélyebben integrálódik a Gemini 2.0-val, megkönnyítve a társalgási keresést, és a mesterséges intelligencia betekintést nyújt átfogó válaszokhoz az összetett kérdésekre, ahogy azt november elején megjósoltuk. A Google Workspace-en belül a Gemini 2.0 által vezérelt mesterséges intelligencia alapú funkciók olyan alkalmazásokba integrálva vannak, mint a Dokumentumok, a Diák és a Meet, javítva a termelékenységet és az együttműködést.

Gyorsabb reakció és jobb akkumulátor-élettartam

A Gemini 2.0 Flash megduplázza az 1.5-ös verzió sebességét. A legújabb verzió teljes neve Gemini 2.0 Flash Experimental. Korszerűsítették a sebesség és a reakciókészség érdekében. A Gemini 2.0 Flash nagyobb teljesítményt nyújt, miközben csökkenti a késleltetést. Ez lehetővé teszi a Gemini 2.0 Flash számára, hogy jobban támogassa a valós idejű multimodális interakciókat. A Gemini 2.0 Flash jelentős teljesítményjavulást ígér. A Google azt állítja, hogy kétszer olyan gyors, mint elődje. A gyorsabb reakció természetessé és gördülékenyebbé teszi az interakciókat. Az audiobeszélgetéseknél a késleltetés csökkentése csökkentheti a késést, és vonzóbb és valósághűbb élményt teremthet. A Gemini 2.0 Flash meghosszabbíthatja a mobileszközök mesterséges intelligencia-folyamatainak akkumulátorának élettartamát, ami ritkább töltést jelenthet, amit mindenki értékelni fog.

Li-ion_battery_illustr._fig.

A NotebookLM felhasználói felület újra feltalálva

A Gemini 2.0 megjelenése párhuzamos iterációt jelent a NotebookLM-ben. Ez az iteráció túlmutat az alapvető AI-képességeken, és kiterjed a felhasználói felületre is. Az újratervezés célja, hogy a felhasználók intuitívabban és hatékonyabban dolgozhassanak jegyzeteikkel és dokumentumaikkal. A munkafolyamatok egyszerűsítésére, a navigáció javítására és a kifinomultabb vizuális környezet biztosítására összpontosít.

Gemini_2_0_kiemelések
Gemini 2.0 a régebbi verziókhoz képest

A mai nap legolvasottabb

.
  翻译: