Para encerrar o ano da inteligência artificial, o Google acaba de lançar seu modelo de IA mais ambicioso chamado Gemini, considerado como o “maior e mais capaz modelo de IA do Google”.
A empresa anunciou uma “era Gemini”, onde o modelo será amplamente usado em empresas e dispositivos de consumo, como por exemplo seu smartphone Google Pixel.
Ao contrário dos modelos de IA existentes que se concentram em um tipo de entrada, como texto ou imagens, o Gemini é “multimodal” e pode aceitar diferentes tipos de mídia, como texto, imagens, áudio e vídeo como entradas.
O chatbot de IA Bard, do Google, foi atualizado com o Gemini, e o Google planeja adicionar o Gemini a produtos amplamente utilizados, como Pesquisa, Chrome e seus serviços de nuvem.
Mas será que é o suficiente para derrotar o GPT-4? O que ele pode fazer agora e no futuro? E se você quer usar Gemini, como exatamente fazer isso?
Se você está curioso sobre os mais recentes esforços de IA do Google, continue lendo.
Afinal, o que é o Google Gemini?
Gemini é o mais recente modelo de linguagem grande (LLM) do Google. O que é um LLM? É o sistema que sustenta os tipos de ferramentas de IA que você provavelmente já interagiu na Internet, como por exemplo, o GPT-4.
No caso do Google, o Gemini será tecido em uma ampla gama de ferramentas, como o chatbot Bard, a Pesquisa Google, o YouTube e muito mais. Em outras palavras, Gemini não é um chatbot em si, mas o “cérebro” que faz com que ele (e outras ferramentas) funcionem.
O Google também especificou que criou três variantes, ou “tamanhos”, do Gemini: Nano, Pro e Ultra. O Nano agora está dentro do Pixel 8 Pro e destinado a outros dispositivos móveis, enquanto o Gemini Pro já encontrou seu caminho no Google Bard.
O Ultra, por sua vez, foi projetado para “tarefas altamente complexas”, embora também chegue à Bard assim que o Google concluir extensos testes e salvaguardas.
Quais as funções do Google Gemini?
Como uma ferramenta de IA multimodal, Gemini pode lidar com várias formas de entrada e saída, incluindo texto, código, áudio, imagens e vídeos. Isso lhe dá muita flexibilidade para executar uma ampla gama de tarefas.
O evento de lançamento do Google Gemini mostrou as habilidades da ferramenta em um vídeo “mão na massa”. Gemini podia ser visto seguindo uma bola de papel escondida sob um copo e entendendo o truque de moeda de um usuário. (Você pode conferir o vídeo no YouTube aqui)
Ele poderia prever o que um quebra-cabeça ponto a ponto mostrava antes de uma única linha ser desenhada e explicar quando um caminho em um mapa pode levar ao perigo e outro pode levar à segurança.
Melhor ainda, tudo isso aparentemente aconteceu em tempo real, com um humano fazendo uma pergunta a Gemini e rapidamente obtendo uma resposta precisa. Ele sugeriu que conversas naturais e fluidas serão possíveis com o chatbot do Google.
Uma postagem separada no blog do Google mostrou como a demonstração foi realmente criada – alimentando quadros de imagens estáticas do Gemini a partir das imagens capturadas e solicitando o modelo de IA usando texto, em vez de voz.
Portanto, embora o vídeo mostre saídas reais de Gemini, ainda estamos muito longe das conversas em tempo real que ele retrata.
Lançamento do Google Gemini
O Gemini Pro já está em alta, já que o Google Bard foi atualizado para conter a tecnologia. Ele tem algumas limitações, no entanto, como ele só funciona com prompts de texto e está disponível apenas em inglês.
Além disso, o Gemini Pro também está sendo lançado para o Google AI Studio e Google Cloud Vertex AI, que são ferramentas para desenvolvedores prototiparem aplicativos e gerenciarem dados, respectivamente. Isso acontecerá no dia 13 de dezembro.
Já o Gemini Ultra levará um pouco mais de tempo para chegar ao público, pois o Google diz que atualmente está “concluindo extensas verificações de confiança e segurança” para garantir que seja confiável e preciso. Como é o modelo Gemini mais poderoso, ele pode ser mais capaz de criar conteúdo perigoso e desinformação, daí a necessidade de testes mais extensos.
Quanto ao Gemini Nano, ele também está disponível no momento, embora de forma muito limitada.
O Google lançou uma atualização de software para o smartphone Pixel 8 Pro, que adicionou o Gemini Nano aos recursos do dispositivo. A empresa diz que adicionou o Gemini ao recurso Smart Reply em seu teclado Gboard, além de incorporá-lo ao recurso Summarize do aplicativo Recorder.
Além do Pixel 8 Pro, o Google diz que “a família mais ampla de modelos Gemini desbloqueará novos recursos para a experiência Assistant with Bard no início do próximo ano no Pixel“. Fique de olho nas atualizações por lá.
O Google Gemini é gratuito?
No momento, não sabemos muito sobre os preços do Gemini, embora possamos dar algumas dicas do que já foi lançado.
O Gemini no Google Bard é gratuito e não requer nenhum sistema de pagamento ou crédito para usar. Da mesma forma, o Gemini Nano chegou ao smartphone Pixel 8 Pro em uma atualização gratuita.
É possível que o Google cobre pelo Gemini Ultra, dadas suas capacidades mais poderosas, de forma semelhante a como a OpenAI cobra US $ 20 por mês pelo acesso ao ChatGPT Plus. Não houve nenhuma palavra oficial sobre isso do Google, no entanto, por enquanto é apenas especulação.
Confira também: Buscador do Google ganhará novos recursos de IA com Gemini.
Como usar o Google Gemini
A maneira como você usa o Google Gemini depende da versão em que você está interessado e do produto ao qual ele foi integrado. A maneira mais óbvia de usá-lo, porém, é com o Google Bard.
Basta digitar um prompt e aguardar a resposta do Bard. Você pode pedir quase qualquer coisa – a previsão do tempo, um pedido para a Bard criar alguma poesia, ajudar com seu projeto de codificação e muito mais – embora tenha salvaguardas embutidas contra conteúdo ilegal ou prejudicial.
Se você tem um celular Pixel 8 Pro, há algumas maneiras de usar o Gemini Nano. A primeira é usar o teclado Gboard.
Em uma conversa do WhatsApp, você verá sugestões de respostas aparecendo abaixo de uma mensagem de um contato. Em seguida, basta tocar na resposta e ela será enviada. Esse recurso – chamado Smart Reply – chegará a outros aplicativos no próximo ano, diz o Google.
No aplicativo Recorder em um Pixel 8 Pro, o Gemini é capaz de resumir conversas gravadas, apresentações e muito mais. Ele faz isso no dispositivo, o que significa que funcionará mesmo sem uma conexão com a internet.
Teremos que esperar para descobrir como o Gemini Ultra funciona, mas dado como o Google o posicionou como algo projetado para “tarefas altamente complexas”, muitos de seus aplicativos podem ser projetados para pesquisadores e usuários da indústria em vez do público em geral.
Dito isso, sabemos que ele está chegando ao chatbot do Google como Bard Advanced, então poderemos experimentar isso quando ele finalmente chegar.
Você também pode gostar:
- Quais as 10 melhores alternativas ao ChatGPT.
- 10 melhores ferramentas de IA para criadores de conteúdo
Gostou da novidade? Compartilhe este artigo nas suas redes sociais!