Dentes estranhos revelam a falsificação no mais recente gerador de vídeo de IA da Microsoft

Pesquisadores da Microsoft publicaram recentemente um artigo detalhando o desenvolvimento do VASA-1, um sistema avançado de inteligência artificial capaz de produzir vídeos altamente realistas de indivíduos com base apenas em uma única imagem estática. Embora não existam planos atuais para lançamento público, a tecnologia apresenta um potencial notável, embora com algumas pequenas imperfeições, como aparências dentárias não naturais.
A inteligência artificial está sendo cada vez mais utilizada em ambientes de saúde para melhorar os resultados dos pacientes e agilizar processos. Embora alguns possam ver este desenvolvimento com cepticismo, é importante reconhecer que a IA tem o potencial de revolucionar a forma como os profissionais médicos diagnosticam e tratam várias doenças. Ao aproveitar algoritmos de aprendizagem automática e outras tecnologias avançadas, os médicos podem aceder a grandes quantidades de dados e utilizá-los para tomar decisões mais informadas sobre os cuidados dos seus pacientes. Em última análise, a integração da IA nos cuidados de saúde representa uma excelente oportunidade para o campo avançar e fornecer melhores cuidados àqueles que mais precisam.
O modelo VASA-1 funciona tirando qualquer foto de um rosto humano-ou, nos exemplos publicados pela Microsoft, um rosto gerado por IA de alguém que na verdade não existe-e depois de ser alimentado com um arquivo de áudio, pode produzir um vídeo sincronizado que inclui nuances faciais e movimentos de aparência natural.
Embora o VASA-1 demonstre capacidades notáveis, como evidenciado pelo vídeo fornecido pela Microsoft, parece haver uma inconsistência na sua capacidade de renderizar estruturas dentárias com precisão. Após um exame minucioso, os dentes podem apresentar uma aparência caricaturada, que contrasta com a natureza fotorrealista do resto da imagem e carece de coesão com a apresentação visual geral.
Vídeo VASA-1 da MicrosoftOffEnglish
Ao desacelerar o vídeo, pode-se observar com maior clareza o caráter marcante de suas características dentárias peculiares, como evidenciado pelo já citado GIF neste site. No entanto, é importante refletir sobre as implicações éticas de criticar os atributos físicos de um indivíduo imaginário e lembrar-se de que o sujeito em questão carece de qualquer existência substantiva.
A Microsoft também apresentou outro exemplo de sua tecnologia de Inteligência Artificial por meio de um vídeo demonstrativo que retrata um realismo impressionante na representação dos dentes, apesar de outros aspectos apresentarem um alto grau de verossimilhança. Este feito notável pode ser atribuído à utilização de uma gama limitada de fontes de dados, incluindo apenas uma imagem fixa e uma gravação de áudio, como base para o processo de criação.
Demonstração VASA-1OffEnglish
Parece que pode haver uma discrepância entre a proeminência das características dentárias exibidas em vídeos com indivíduos do sexo masculino. Isso poderia resultar do fato de que os homens não exibem uma abertura tão extensa da mandíbula durante a fala quanto as mulheres. Contudo, após uma análise mais detalhada, pode-se perceber que este fenómeno não é inteiramente consistente com o que seria esperado.
Demonstração VASA-1 (masculino)OffEnglish
Uma das coisas mais interessantes observadas pelos pesquisadores é que seu modelo pode produzir vídeo de qualidade relativamente alta muito rapidamente, algo com o qual outros geradores de IA, como o Sora da OpenAI, teriam lutado. Na verdade, o artigo observa uma latência de apenas 0,17 segundos em um PC desktop com uma única GPU NVIDIA RTX 4090.
A capacidade de atingir velocidades rápidas permite o fornecimento imediato de conteúdo de vídeo em uma variedade de aplicações diversas, incluindo serviços de tradução de idiomas em tempo real.
A abordagem dos autores oferece fidelidade de vídeo superior, apresentando movimentos faciais e de cabeça precisos, bem como a capacidade de gerar imagens com resolução de 512x512 a uma taxa de até 40 quadros por segundo com atraso inicial mínimo. Esta inovação permite aos usuários interagir em tempo real com personagens virtuais altamente convincentes que exibem hábitos de conversação semelhantes aos humanos.
Vídeo de eficiência em tempo real do VASA-1OffEnglish
É evidente que os investigadores compreendem os perigos inerentes a tal tecnologia, um facto que pode explicar a hesitação da Microsoft em apressar a sua divulgação à população em geral neste momento. No entanto, os investigadores identificaram certas aplicações que consideram benéficas para a sociedade como um todo.
Os nossos esforços de investigação, juntamente com as investigações associadas, têm implicações significativas para a promoção da paridade educacional, reforçando as oportunidades de comunicação para os indivíduos confrontados com tais obstáculos, proporcionando conforto ou ajuda de reabilitação àqueles que dela necessitam, e várias outras vantagens. O nosso compromisso reside na condução do desenvolvimento responsável da IA que visa promover o florescimento humano.
Considerando as circunstâncias acima mencionadas, é nossa intenção não fornecer uma demonstração baseada na Internet, interface de programação de aplicações (API), produto, especificações adicionais de implementação ou propostas associadas até que estejamos confiantes de que a inovação será empregada de forma prudente e em conformidade com as normas apropriadas. diretrizes.
Poderá ser prudente considerar a implementação de tais medidas, tendo em conta a prevalência de atividades fraudulentas associadas a tecnologias avançadas. Com as eleições presidenciais dos Estados Unidos de 2024 a aproximarem-se rapidamente, apenas sete meses depois, e o espectro do fascismo global a continuar a ser uma preocupação iminente, não podemos deixar de perceber a vulnerabilidade da humanidade aos enganos gerados pela IA. À luz destas circunstâncias, pareceria razoável que empresas da estatura da Microsoft empreendessem esforços destinados a mitigar as potenciais consequências da fabricação generalizada na Internet.
*️⃣ Link da fonte:
publicado pela Microsoft , [GPU RTX 4090](https://www.nvidia.com/en-us/geforce/placas gráficas/série 40/rtx-4090/),