Marca+

Novo ChatGPT-4o analisa vídeos, imagens e traduz em tempo real

Com funcionalidades novas como interagir com a câmera do usuário ou ver sites em tempo real, o novo GPT-4o deve ser liberado para todos usuários.
Lucas Morais, Jean Felipe em 13/maio/24, atualizado 26/out/24 às 09h – Compartilhe
Garota em Shinjuku, Japão, "testando" aplicativo. Acervo exclusivo do Eu, Brasileiro (Jean Felipe).
Garota em Shinjuku, Japão, "testando" aplicativo. Acervo exclusivo do Eu, Brasileiro (Jean Felipe).

A OpenAI revelou o GPT-4o, a mais recente interação de sua inteligência artificial (IA) que alimenta o ChatGPT. Sua disponibilização está sendo feita de forma progressiva para todos os usuários, incluindo aqueles que estão utilizando a versão gratuita.

Esse é o primeiro modelo a conseguir processar imagens e vozes em tempo real. Nas versões anteriores, o ChatGPT dependia de outros modelos de IA para interpretar comandos de voz e imagens. A expectativa é de que essa alteração torne o ChatGPT ainda mais ágil, com várias funcionalidades diferentes.

Dentre uma das funcionalidades mais esperadas, era a de que o novo ChatGPT conseguisse “ler” sites em tempo real. Essa função já existia em outras ferramentas de IA no mercado, mas nunca funcionava como o esperado por muito tempo por estas IAs. Todavia, outras novidades não tão esperadas pela maioria do público chegaram pegando muitos de surpresa.

Novo: Capacidade de interagir em tempo real

Com a chegada do GPT-4o, o ChatGPT adquire a capacidade de interagir em tempo real, incluindo recursos de áudio e imagem que permitem a reprodução de áudios e a interpretação de fotos e vídeos, como os do YouTube, durante as conversas. Possibilitando ainda uma precisão impressionante na tradução simultânea entre duas pessoas que não falam o mesmo idioma, conforme demonstrado no vídeo abaixo.

Vídeo de demonstração do GPT-4o pelo canal oficial do OpenAI.

Novo: Reconhecimento de imagens

Na apresentação, foram ressaltadas melhorias no reconhecimento de imagens. Um exemplo prático foi a identificação e resolução de uma equação matemática simples, na qual o ChatGPT auxiliou na solução de um problema envolvendo geometria analítica.

Vídeo de demonstração do GPT-4o pelo canal oficial do OpenAI.

Novo: Reconhecimento de objetos externos tridimensionais

O modelo GPT-4o realiza o reconhecimento de objetos externos tridimensionais através do processamento de informações visuais em tempo real. Utilizando técnicas de visão computacional, o modelo é capaz de analisar imagens ou vídeos e identificar objetos tridimensionais presentes no ambiente e descrevê-los em qualquer idioma.

Vídeo de demonstração do GPT-4o pelo canal oficial do OpenAI.

Novo: Interpretação de expressões faciais

Através de técnicas avançadas de processamento de imagem e aprendizado de máquina, o novo modelo é capaz de identificar padrões faciais e interpretar as emoções expressas pelo rosto de uma pessoa. Além disso, o GPT-4o tem a funcionalidade de identificar e interpretar situações diferentes, como nesse exemplo abaixo onde a IA dá dicas sobre como o rapaz deve se portar em uma entrevista de emprego e o que ele deve vestir.

Vídeo de demonstração do GPT-4o pelo canal oficial do OpenAI.

A OpenAI está iniciando a liberação dos recursos de texto e imagem do GPT-4o nesta segunda-feira. Os usuários da versão gratuita poderão acessá-lo, porém o limite de mensagens não foi especificado, enquanto os assinantes do ChatGPT Plus terão um limite maior. A utilização do GPT-4o com comandos de voz estará disponível nas próximas semanas para os assinantes do ChatGPT Plus.

O lançamento do novo produto acontece em meio aos esforços da OpenAI para manter-se à frente da concorrência crescente na corrida pela liderança em IA. Empresas rivais como Google e Meta têm se dedicado ao desenvolvimento de modelos de linguagem cada vez mais robustos, os quais podem ser aplicados em uma variedade de produtos de IA.

O mais recente lançamento do GPT pode representar uma vantagem para a Microsoft, que investiu significativamente na OpenAI com o objetivo de integrar sua tecnologia de IA em seus próprios produtos.

Compartilhar:

Selecione uma marca para ir ao assunto relacionado:

Marca
Últimas Novidades

Siga-nos! Facebook, X (Twitter)

A inteligência artificial (IA) tem avançado bastante nas últimas décadas, transformando diversos setores da sociedade e levantando uma questão: a IA superará a inteligência humana?
A tecnologia esportiva tende a alcançar um patamar cada vez maior nos próximos anos, graças ao advento da IA e outras ferramentas.
Conheça detalhes do Sora, novo projeto da OpenAI que promete ser uma revolução no mercado audiovisual.
Tudo indica que 2024 vai ser um grande ano tanto para a Inteligência Artificial (IA) quanto para a Web3, que é a próxima geração da internet.
Seria possível que uma civilização tão avançada tenha existido no coração da maior floresta tropical do mundo?
O Sistema Toyota de Produção (TPS) otimiza eficiência e qualidade por meio de práticas como Just-in-Time, Jidoka, Kanban, Kaizen e os princípios 5S.
Você aceita ou nega os cookies? Saiba mais sobre como usar seu navegador para gerenciar cookies já armazenados e negar novos.
Quem não quer rejuvenescer? Pesquisador de Harvard explica maneiras de prolongar a longevidade das pessoas.
Linha do tempo foi baseada em diversas fontes, incluindo entrevistas, podcasts do Ian Flynn, além de informações dos manuais e os jogos em si.