OpenAI apresenta assistente de voz do ChatGPT após atraso para aumentar segurança

A OpenAI vai lançar um assistente de voz muito aguardado para o ChatGPT, com um número limitado de usuários, após ter adiado o lançamento para solucionar possíveis problemas de segurança. A startup de inteligência artificial informou que tornará o recurso de voz disponível para um pequeno grupo de clientes pagantes do ChatGPT Plus a partir da próxima terça-feira.

O produto oferecerá quatro vozes predefinidas, mas não será capaz de imitar como outras pessoas falam, segundo a empresa. A OpenAI também acrescentou novos filtros para garantir que o software possa identificar e recusar alguns pedidos para gerar música ou outros tipos de áudio protegidos por direitos autorais.

A opção de voz foi um dos destaques do evento de lançamento de produtos da empresa em maio para o GPT-4o, uma versão atualizada do modelo GPT-4 que é mais eficiente em lidar com texto, áudio e imagens em tempo real.

A startup havia introduzido uma opção mais limitada para o ChatGPT conversar com os usuários no ano passado, mas o novo recurso promete ser mais rápido e combinar com poderosas capacidades de reconhecimento de imagem para transformar o chatbot num parceiro de conversa muito mais útil e dinâmico.

A OpenAI havia informado anteriormente que pretendia lançar o assistente de voz para um pequeno grupo de assinantes pagos do ChatGPT Plus no fim de junho, mas decidiu que precisava de mais um mês para atingir o padrão de lançamento.

A empresa disse que estava trabalhando na capacidade do software de identificar e recusar responder a certos tipos de conteúdo, e garantir que ele pudesse processar efetivamente solicitações de milhões de usuários.

Em um comunicado oficial feito ontem, a OpenAI disse que, ao lançar o recurso de forma gradual, poderá monitorar de perto o uso e melhorar a capacidade e a segurança do modelo com base no feedback do mundo real.

Além disso, a empresa reiterou seu plano de disponibilizar o recurso de voz para todos os assinantes pagos do ChatGPT Plus no outono do Hemisfério Norte, e mencionou que está trabalhando nos recursos de vídeo e compartilhamento de tela demonstrados durante o evento de maio. Esses recursos ainda não têm uma data de lançamento definida.

Como resultado, o recurso de voz terá uma lista de capacidades mais limitada no início. Por exemplo, o chatbot não será capaz de acessar um recurso de visão computacional que permitiria oferecer feedback falado sobre os movimentos de dança de uma pessoa simplesmente usando a câmera do smartphone, por exemplo.

Source link

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima