Google förbättrar Gemini AI med Canvas för kodning och AI-genererade ljudöversikter

Google har introducerat två stora uppdateringar av sin Gemini AI-assistent:DukochLjudöversikt, utökar dess AI:s kapacitet till att inkludera kodningssamarbete i realtid och AI-genererade sammanfattningar i podcast-stil. Dessa nya funktioner syftar till att förbättra produktivitet, tillgänglighet och användarinteraktion med AI-genererat innehåll, vilket positionerar Gemini AI som en seriös konkurrent till OpenAIs ChatGPT och Anthropics Claude.

Den nyligen avtäckta Canvas ger användarna ett dedikerat utrymme för att skapa och förfina dokument och kod med hjälp av AI i realtid. Denna funktion tillåter användare att arbeta interaktivt med Gemini AI, liknande befintliga live-kodningsmiljöer som GitHub Copilot eller OpenAIs Codex.

Googles Canvas integreras direkt med Gemini, vilket gör det möjligt för användare att mata in kodningsuppmaningar och se liveförhandsvisningar av deras arbete. Detta samarbete i realtid säkerställer att programmerare kan felsöka, optimera och förfina sin kod effektivt. Funktionen förväntas vara särskilt användbar för mjukvaruutvecklare som vill påskynda arbetsflöden genom att utnyttja AI för förslag, felsökning och strukturella förbättringar.

Introduktionen av Canvas signalerar Googles bredare strategi att integrera AI i verkliga applikationer, vilket speglar OpenAIs egen push med ChatGPT-plugins och Microsofts expansion av Copilot inom sina utvecklarverktyg. Till skillnad från ChatGPTs nuvarande textbaserade kodningshjälp ger Googles tillvägagångssätt ett visuellt och interaktivt utrymme, vilket gör AI-driven kodning mer tillgänglig.

Ett annat betydande tillägg till Gemini AI är Audio Overview, en funktion som förvandlar skrivet innehåll till dynamiska, AI-genererade podcast-liknande diskussioner. Det här verktyget är designat för användare som föredrar auditiv inlärning eller vill konsumera information på språng. I likhet med hur OpenAIs ChatGPT kan generera textbaserade sammanfattningar, tar Googles Audio Overview det ett steg längre genom att skapa engagerande förklaringar i konversationsstil med AI-genererade röster.

Funktionen är för närvarande tillgänglig på engelska, med planer på ytterligare språk i framtiden. Det kan hjälpa Google att få fotfäste som en nyckelspelare i AI-ljudområdet, och konkurrera med tjänster som Spotifys AI-genererade podcastrekommendationer och Apples maskininlärningsdrivna ljudsammanfattningar i Apple Podcasts.

Läs mer:Google Dokument introducerar ljudöversikter för att hjälpa användare att rätta till skrivfel

Båda dessa funktioner förstärker Googles engagemang för att integrera AI i vardagliga uppgifter, vilket ger användarna verktyg som förbättrar både produktivitet och tillgänglighet. Genom att erbjuda en AI-arbetsyta för kodning och ett ljudalternativ till texttungt innehåll, utvecklas Gemini AI bortom en enkel chatbot till en fullfjädrad AI-assistent med praktiska verkliga applikationer.

Dessa uppdateringar ärnu tillgängligtill Gemini och Gemini Advanced-prenumeranter, med större tillgänglighet förväntas under de kommande månaderna. När Google fortsätter att förfina sina AI-modeller visar dessa tillägg upp företagets pågående ansträngningar att leda det AI-drivna produktivitetsområdet.

Källa:The Verge