A corrida pela supremacia da inteligência na artificial ganhou um novo capítulo com o lançamento de Gemini, a mais recente investida do Google no cenário de IA. Este modelo de linguagem multimodal (LLM) é aclamado como a tecnologia mais avançada da gigante da tecnologia, prometendo um salto significativo na já acirrada “corrida da IA”.
O que é o Gemini?
Após alguns adiamentos, o Google finalmente apresentou ao mundo o Gemini, uma inteligência artificial projetada para superar seu antecessor, o Bard. O LLM é uma inovação que permite a organização, compreensão e combinação de diferentes tipos de informação, incluindo textos, imagens, vídeos, áudios e até mesmo códigos de programação.
De acordo com Demis Hassabis, CEO e cofundador do Google DeepMind, o Gemini é a “IA carro-chefe” da empresa, propôs a transferência de diversos produtos e serviços em seu portfólio.
Como funciona o Gemini?
O Gemini é descrito pelo Google como um modelo flexível capaz de operar em uma ampla gama de dispositivos, desde data centers até smartphones. Para atingir essa escalabilidade, a IA foi lançada em três tamanhos diferentes: Gemini Nano, Gemini Pro e Gemini Ultra.
- Gemini Nano: Projetado para smartphones, como o Google Pixel 8, este modelo executa tarefas no dispositivo, como sugerir respostas em aplicativos de bate-papo ou currículo de texto, sem depender de servidores externos.
- Gemini Pro: Rodando nos data centers do Google, o Gemini Pro alimenta a versão mais recente do Bard, oferecendo tempos de resposta rápidas e compreensão de consultas complexas.
- Gemini Ultra: Ainda não disponível para uso geral, este é o modelo mais eficaz do Google, destinado a realizar tarefas altamente complexas.
Diferenciais da IA Gemini
Ao contrário de outros modelos LLM, o Gemini foi construído desde o início para ser multimodal. Essa abordagem permite que a IA compreenda e combine diferentes tipos de dados de maneira mais natural, representando uma evolução significativa em relação às IAs anteriores.
A ferramenta foi treinada usando os avançados chips de IA internos e unidades de processamento de tensores do Google, como TPU v4 e v5e, tornando-a flexível e eficiente.
Gemini já está disponível?
O Gemini Pro já está disponível para usuários em mais de 170 países, através do Bard, inicialmente apenas na versão em inglês. O Gemini Nano também está disponível para smartphones, especificamente no modelo Pixel 8. Desenvolvedores e clientes corporativos terão acesso ao Gemini Pro por meio da API Gemini no AI Studio do Google e no Google Cloud Vertex AI a partir de 13 de dezembro.
Nos próximos meses, o Google planeja integrar o Gemini em mais produtos e serviços, como Busca, Ads, Chrome e Duet AI. O aguardado Gemini Ultra está programado para chegar ao mercado no início de 2024.
Como usar o Gemini?
Por enquanto, o Gemini funciona exclusivamente dentro do Bard, na versão em inglês. Para experimentar a IA, os usuários devem seguir alguns passos simples:
- Acesse sua conta do Google;
- Clique nos três pontos no canto superior direito da tela e selecione ‘Configurações’;
- Em seguida, clique em “gerenciar sua conta do Google”;
- Clique em “Informações pessoais” e procure por “Preferências gerais para a Web”;
- Selecione “Idioma” e salve o inglês como preferido.
Após essa alteração, os usuários poderão explorar as capacidades do Gemini normalmente, interagindo por meio de perguntas ou conversas com a IA por meio de textos ou áudios, além de fazer o upload de imagens para identificação.
O Google promete que o Gemini marca um novo padrão em inteligência artificial, e sua disponibilidade crescente sinaliza uma era empolgante de inovação e integração de IA em diversos aspectos de nossas vidas digitais.