Un logo bleu et blanc pour un outil de gestion des médias sociaux appelé Socialionals.

Modèle de diffusion

Partager
" Retour à l'index des glossaires

Dans les domaines de la vision par ordinateur, de la génération d'images et du traitement du langage naturel, les modèles de diffusion sont des outils fondamentaux. Ils sont utilisés pour des fonctions telles que le débruitage d'images, l'inpainting, la super-résolution et la génération de texte, avec la possibilité de s'entraîner à la suppression du bruit gaussien dans les images floues. Des exemples notables de ces modèles comprennent les modèles probabilistes de diffusion de débruitage et les réseaux de scores conditionnés par le bruit. En thermodynamique hors équilibre, ces modèles jouent un rôle essentiel dans l'échantillonnage de distributions de probabilités complexes. Ils sont ensuite optimisés grâce à des méthodologies avancées telles que les modèles variationnels. déduction[1] et la descente de gradient stochastique. Dans le traitement du langage naturel, les modèles de diffusion jouent un rôle essentiel dans la génération et le résumé de textes, en maîtrisant la structure cachée des données textuelles pour produire un texte adapté au contexte. Des entités de recherche renommées comme OpenAI et Google[2] Imagen a mis au point divers modèles de diffusion pour des tâches liées à la génération d'images et de textes.

Définitions des termes
1. déduction. L'inférence, un processus mental, consiste à tirer des conclusions à partir de preuves existantes et d'un raisonnement logique. Elle fait partie intégrante de la pensée critique et de la résolution de problèmes, et trouve de nombreuses applications dans des domaines tels que la recherche scientifique, l'analyse littéraire et l'intelligence artificielle. Il existe différentes formes d'inférence : déductive, inductive, abductive, statistique et causale, chacune ayant sa propre méthode et son propre objectif. Par exemple, l'inférence déductive s'attache à tirer des conclusions spécifiques à partir de principes généraux, tandis que l'inférence inductive génère des conclusions générales à partir d'exemples spécifiques. Inversement, l'inférence abductive consiste à formuler des hypothèses éclairées sur la base de preuves accessibles, tandis que les inférences statistiques et causales consistent à interpréter des données afin de tirer des conclusions sur un groupe ou d'établir des liens de cause à effet. Néanmoins, la précision des inférences peut être affectée par des biais, des idées préconçues et des interprétations erronées. Malgré ces obstacles potentiels, il est possible d'améliorer les capacités d'inférence par une pratique régulière, des activités de réflexion critique et l'exposition à une variété de lectures.
2. Google ( Google ) Principalement connu pour son moteur de recherche, Google est une entreprise technologique universellement estimée. Créée en 1998 par Sergey Brin et Larry Page, l'entreprise s'est considérablement développée, se diversifiant dans de nombreux domaines liés à la technologie. Google propose un large éventail de services et de produits, notamment Android, YouTube, Cloud, Maps et Gmail. L'entreprise fabrique également du matériel comme les Chromebooks et les smartphones Pixel. Depuis 2015, Google est une filiale d'Alphabet Inc. et est réputée pour son esprit inventif et son environnement de travail qui favorise les projets personnels des employés. Malgré plusieurs défis éthiques et juridiques, Google continue d'influencer le secteur de la technologie grâce à ses innovations révolutionnaires et à ses progrès technologiques, notamment la création d'Android OS et l'achat d'entreprises spécialisées dans l'IA.

En apprentissage automatique, modèles de diffusionégalement connu sous le nom de modèles probabilistes de diffusion ou modèles génératifs basés sur le scoresont une classe de variable latente génératif modèles. Un modèle de diffusion se compose de trois éléments principaux : le processus avant, le processus arrière et la procédure d'échantillonnage. L'objectif des modèles de diffusion est d'apprendre un processus de diffusion qui génère une distribution de probabilité pour un ensemble de données donné, à partir de laquelle nous pouvons ensuite échantillonner de nouvelles images. Ils apprennent la structure latente d'un ensemble de données en modélisant la manière dont les points de données se diffusent à travers leur espace latent.

Dans le cas de vision par ordinateurLes modèles de diffusion peuvent être appliqués à toute une série de tâches, notamment débruitage d'images, peinture, super-résolutionet génération d'images. Il s'agit généralement de former un réseau neuronal pour qu'il puisse séquentiellement débruiter images brouillées par Bruit gaussien. Le modèle est entraîné pour inverser le processus d'ajout de bruit à une image. Après avoir été entraîné jusqu'à convergence, il peut être utilisé pour la génération d'images en commençant par une image composée d'un bruit aléatoire que le réseau dénature de manière itérative. Annoncé le 13 avril 2022, OpenAIModèle texte-image DALL-E 2 est un exemple qui utilise des modèles de diffusion à la fois pour le modèle préalable (qui produit un encastrement d'image à partir d'une légende textuelle) et pour le décodeur qui génère l'image finale. Les modèles de diffusion ont récemment trouvé des applications dans le traitement du langage naturel (NLP), en particulier dans des domaines tels que la génération de texte et le résumé.

Les modèles de diffusion sont généralement formulés comme suit chaînes de Markov et formés à l'aide de l'inférence variationnelle. Des exemples de cadres génériques de modélisation de la diffusion utilisés en vision par ordinateur sont les modèles probabilistes de débruitage de la diffusion, les réseaux de scores conditionnés par le bruit et les équations différentielles stochastiques.

" Retour à l'index des glossaires
fr_FRFrançais