Conheça a melhor ferramenta de automação para WhatsApp e chatbots

OpenAI lança GPT-4o em modelo ominmodal com áudio, vídeo e foto

A OpenAI anunciou nesta segunda-feira (13) um marco importante no desenvolvimento de inteligência artificial: o lançamento de um novo modelo de IA, chamado GPT-4o, e uma versão desktop do ChatGPT, acompanhada de uma interface de usuário renovada. A notícia foi divulgada por Mira Murati, CTO da empresa, durante um evento transmitido ao vivo. Acessibilidade e […]

Giovanna Torreão

13/05/2024

OpenAI lança GPT-4o em modelo ominmodal com áudio, vídeo e foto

A OpenAI anunciou nesta segunda-feira (13) um marco importante no desenvolvimento de inteligência artificial: o lançamento de um novo modelo de IA, chamado GPT-4o, e uma versão desktop do ChatGPT, acompanhada de uma interface de usuário renovada.

A notícia foi divulgada por Mira Murati, CTO da empresa, durante um evento transmitido ao vivo.

Acessibilidade e Capacidades Ampliadas do GPT-4o

De acordo com Murati, a versão atualizada do ChatGPT apresenta melhorias significativas nas funcionalidades relacionadas a texto, imagens e áudio, tornando a plataforma mais acessível a todos os usuários, incluindo os que utilizam a versão gratuita oferecida pela OpenAI.

“Estamos dando um salto significativo em termos de facilidade de uso pela primeira vez”, enfatizou Murati. Ela também mencionou que os assinantes poderão processar “cinco vezes” mais conteúdo na versão paga.

Avanços Tecnológicos

O GPT-4o se destaca por ser uma rede neural cinco vezes mais rápida que o GPT-4, mantendo a mesma capacidade de resposta, mas com menor necessidade de processamento de dados.

A nova tecnologia inclui a capacidade de analisar imagens em tempo real, demonstrada ao resolver um problema matemático escrito à mão e contar histórias alterando o tom de voz durante uma transmissão ao vivo.

O que muda na prática?

A expectativa é que com o GPT-4o seja possível falar e mostrar objetos ao robô, recebendo respostas em uma velocidade mais próxima à de um diálogo humano, em vez de simplesmente digitar solicitações.

Nas redes sociais, a nova versão foi comparada à assistente virtual do filme “Ela” (“Her”, no título original), onde o personagem principal se apaixona por um sistema operacional. Essa comparação chamou a atenção de Sam Altman, que mencionou o nome do filme em seu perfil no X (anteriormente Twitter).

Para ilustrar as novidades, a OpenAI lançou um vídeo onde uma pessoa pede ao ChatGPT para avaliar sua roupa para uma entrevista de emprego. Em outra demonstração, utilizaram o sistema para compor uma música.

Anteriormente, o ChatGPT necessitava de várias etapas para processar e responder comandos de voz. Inicialmente, um modelo era usado para converter o áudio em texto. Em seguida, o GPT-3.5 ou o GPT-4 analisava o texto e gerava uma resposta. Por fim, outro modelo reconvertia o texto em áudio.

Segundo a OpenAI, o novo GPT-4o responde a comandos de áudio em média em 320 milissegundos, sendo que o tempo mais rápido registrado foi de 232 milissegundos. Este modelo é consideravelmente mais rápido que seus antecessores: o GPT-3.5 demora em média 2,8 segundos e o GPT-4, que é pago, leva 5,4 segundos. “Com o GPT-4o, treinamos um único modelo de ponta a ponta em texto, visão e áudio, o que significa que todas as entradas e saídas são processadas pela mesma rede neural”, explicou a OpenAI em um comunicado.

O CEO da OpenAI, Sam Altman, destacou que este é o melhor modelo já desenvolvido pela empresa. “É inteligente, é rápido, é nativamente multimodal”, afirmou.

Expansão Global e Desenvolvimento Contínuo

O novo modelo também melhorou a qualidade e a velocidade de resposta do ChatGPT em 50 idiomas diferentes e expandiu a memória do sistema para permitir a retomada de conversas anteriores, mantendo a continuidade do diálogo. Este desenvolvimento é descrito como um dos maiores anúncios da OpenAI desde o lançamento do ChatGPT Enterprise.

A empresa também anunciou que disponibilizará a API para que desenvolvedores possam começar a construir aplicativos com o novo modelo. “O GPT-4o é duas vezes mais rápido e metade do custo do GPT-4 Turbo”, acrescentou Murati.

Impacto no Mercado e Projeções Futuras

Em 2023, foi registrado um investimento recorde de US$ 29,1 bilhões em quase 700 negócios de IA generativa, marcando um aumento de mais de 260% em relação ao ano anterior, segundo dados da CNBC. Estima-se que o mercado de IA possa alcançar US$ 1 trilhão em receitas em uma década.

Após o lançamento inicial do ChatGPT em novembro de 2022, o aplicativo alcançou um crescimento histórico, atingindo cerca de 100 milhões de usuários ativos semanais em um curto período de tempo, tornando-se o aplicativo que mais rapidamente cresceu na história.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Venda mais e atenda melhor. Comece hoje.

Faça o que mais de 5.000 clientes já fizeram. Clique no botão abaixo e receba uma proposta sob medida de acordo com a necessidade da sua empresa.

Quero uma proposta do ChatGuru