Demonstrou-se que o modelo generativo de fluxo de Poisson (PFGM) supera os modelos de difusão tradicionais em tarefas de geração de imagens por um fator de 10 a 20. Conforme relatado pela Quanta Magazine e detalhado em um artigo de pesquisa de Yilun Xu, Ziming Liu, Max Tegmark e Tommi Jaakkola no arXiv, isso ressalta o potencial da IA ​​inspirada na física modelos na revolução do campo da IA ​​generativa.

A ciência por trás do PFGM

O PFGM mapeia uma distribuição uniforme em um hemisfério de alta dimensão em qualquer distribuição de dados. Ele interpreta os pontos de dados como cargas elétricas em um hiperplano em um espaço aumentado com uma dimensão adicional, gerando um campo elétrico de alta dimensão.

À medida que essas cargas fluem para cima ao longo das linhas do campo elétrico, sua distribuição inicial se transforma em um distribuição no hemisfério que se torna uniforme no limite. A abordagem exclusiva deste modelo para geração de imagens é ancorada pela dimensão adicional fisicamente significativa, onde as amostras atingem o coletor de dados não aumentado quando a dimensão chega a zero.

Vantagens comparativas sobre modelos de difusão

Embora os modelos de IA generativos baseados em difusão tenham sido predominante desde 2015, o PFGM oferece vantagens distintas. Ele não apenas produz imagens de alta qualidade, mas também consegue isso em um ritmo significativamente mais rápido. De acordo com a Quanta Magazine, o PFGM pode produzir imagens da mesma qualidade que os modelos baseados em difusão, mas o faz de 10 a 20 vezes mais rápido.

O artigo de pesquisa detalha ainda que o PFGM atinge o que há de mais moderno desempenho artístico entre modelos de normalização de fluxo em CIFAR-10, com uma pontuação inicial de 9,68 e uma pontuação FID de 2,35. Além disso, seu desempenho está no mesmo nível das abordagens SDE de última geração, oferecendo uma aceleração substancial nas tarefas de geração de imagens.

Direções potenciais e futuras

Max Tegmark, físico do MIT, acredita que os princípios da física podem fornecer informações valiosas sobre o funcionamento dos algoritmos de IA. O PFGM é uma prova dessa crença, pois se inspira no movimento de partículas carregadas e nos campos elétricos que elas produzem. A equipe do MIT não para por aqui. Estão a explorar outros processos físicos, como o potencial de Yukawa relacionado com a força nuclear fraca, como bases potenciais para novos modelos generativos. Tais esforços poderiam levar a algoritmos inovadores e modelos generativos com aplicações que vão além da geração de imagens.

Os avanços trazidos pelo PFGM atraíram a atenção de especialistas na área. Hananel Hazan, cientista da computação em Tufts University, destacou o uso inovador do campo elétrico em PFGM, ​​sugerindo que isso poderia abrir caminho para outros fenômenos físicos melhorarem as redes neurais.

Categories: IT Info