Google Bard va intègrer Imagen 2, son générateur d'image maison !
La nouvelle fonctionnalité de Google Bard permettra aux utilisateurs de générer des images photoréalistes de haute qualité en réponse à des prompts textuels. Cette intégration utilise la technologie Imagen 2, la plus avancée de Google en matière de diffusion texte-image. Imagen 2 est connu pour sa capacité à produire des images étroitement alignées sur les instructions des utilisateurs, en utilisant la distribution naturelle de ses données d'entraînement.
Selon les informations divulguées, l'utilisation du générateur d'images dans Bard sera simple et intuitive. Les utilisateurs pourront générer des images en entrant des textes descriptifs, avec la possibilité de créer plusieurs visuels à partir du même prompt. Les images générées pourront être téléchargées pour divers usages.
Plus performant que Midjourney ou Dall-E ?
Vous avez peut-être l'habitude avec les générateur d'images, les visages et surtout les mains leur font très souvent défault, Google a donc concentré ses efforts sur l'amélioration du rendu des mains et des visages humains dans les images générées, ainsi que sur la réduction des artefacts visuels. Ces améliorations ciblent des défis spécifiques dans la génération d'images par IA.
De plus, Imagen 2 a été entraîné avec des légendes d'images enrichies pour une meilleure précision et qualité, améliorant ainsi la compréhension du contexte et des nuances des prompts.
En anglais seulement :(
La fonctionnalité de génération d'images sera initialement disponible uniquement en anglais. Il n'est pas encore clair si des restrictions géographiques ou liées au compte Google seront appliquées.
L'intégration de la technologie de génération d'images Imagen 2 dans Google Bard est un témoignage clair de l'orientation stratégique de Google vers l'enrichissement de ses outils d'intelligence artificielle. Cette mise à jour souligne l'engagement de l'entreprise à fusionner des capacités avancées d'IA, telles que la compréhension du langage naturel et la génération d'images, pour créer des expériences utilisateur plus immersives et interactives.