Be My Eyes, o primeiro aplicativo a integrar o reconhecimento de imagem do GPT-4, da OpenAI, recebe elogios de usuários com deficiência visual.
O primeiro aplicativo a integrar as habilidades de reconhecimento de imagem do GPT-4 foi descrito como “mudança de vida” por usuários com deficiência visual.
A startup dinamarquesa Be My Eyes utilizou o modelo de inteligência artificial em um novo recurso para pessoas cegas ou com baixa visão, chamado de “Voluntário Virtual”. Essa ferramenta de reconhecimento de objetos permite que os usuários enviem imagens e recebam respostas para perguntas sobre elas.
Por exemplo, imagine que um usuário esteja com fome. Ele pode fotografar um ingrediente e solicitar receitas relacionadas. Se preferir comer fora, pode enviar uma imagem de um mapa e obter direções para um restaurante. Ao chegar lá, pode tirar uma foto do cardápio e ouvir as opções. Se quiser queimar as calorias adicionais em uma academia, pode usar a câmera do smartphone para encontrar uma esteira.
“Eu sei que estamos no meio de um ciclo de hype de IA no momento, mas vários de nossos testadores beta usaram a frase ‘mudança de vida’ para descrever o produto”, disse Mike Buckley, CEO da Be My Eyes, ao TNW.
“Isso tem o potencial de ser transformador, capacitando a comunidade com recursos sem precedentes para navegar melhor em ambientes físicos, atender às necessidades cotidianas e ganhar mais independência”.
O Virtual Volunteer utiliza uma atualização do software da OpenAI. Ao contrário das versões anteriores dos modelos da empresa, o GPT-4 é multimodal, o que significa que pode analisar imagens e texto como entrada.
Be My Eyes aproveitou a oportunidade para testar a nova funcionalidade. Embora os sistemas de texto para imagem não sejam novidade, a startup nunca havia ficado convencida com o desempenho do software anteriormente.
“Desde muitos erros até a incapacidade de manter uma conversa, as ferramentas disponíveis no mercado não foram equipadas para resolver muitas das necessidades de nossa comunidade”, diz Buckley.
“O reconhecimento de imagem oferecido pelo GPT-4 é superior, e as camadas analíticas e de conversação alimentadas pela OpenAI aumentam exponencialmente o valor e a utilidade.”
Anteriormente, a Be My Eyes apoiava os usuários exclusivamente com voluntários humanos. De acordo com a OpenAI, o novo recurso pode gerar o mesmo nível de contexto e compreensão. No entanto, se o usuário não receber uma boa resposta ou simplesmente preferir uma conexão humana, ele ainda pode chamar um voluntário.
Apesar dos resultados iniciais promissores, Buckley insiste que o serviço gratuito será lançado com cautela. Os testadores beta e a comunidade em geral desempenharão um papel central na determinação desse processo.
Por fim, Buckley acredita que a plataforma fornecerá aos usuários suporte e oportunidades. A Be My Eyes também ajudará em breve as empresas a atender melhor seus clientes, priorizando a acessibilidade.
“É seguro dizer que a tecnologia pode dar às pessoas cegas ou com baixa visão não apenas mais poder, mas também uma plataforma para a comunidade compartilhar ainda mais seus talentos com o resto do mundo”, diz Buckley. “Para mim, essa é uma possibilidade incrivelmente atraente.”
Fonte: The Next Web
Imagem: Divulgação