OpenAI annonce des mises à jour majeures: introduction de GPT-4 Turbo et plus

18 Nov 2023 à 08:55 par larevuegeek - 618 vues - 0 com.

Informatique Intelligence Artificielle Dev Tech

OpenAI a déployé une panoplie d'innovations et de mises à jour substantielles lors du tout premier événement OpenAI DevDay. Cette conférence tant attendue a été le théâtre d'annonces déterminantes qui pourraient redéfinir la manière dont nous interagissons avec la technologie au quotidien. Voici un tour d'horizon détaillé des principales annonces qui ont marqué cette journée.

Lancement de GPT-4 Turbo : L'IA linguistique

OpenAI a introduit GPT-4 Turbo, qui s'annonce comme un jalon révolutionnaire dans la course à l'intelligence artificielle la plus avancée. Ce modèle élargit considérablement la fenêtre de contexte jusqu'à 128K et se base sur des informations à jour jusqu'en avril 2023, promettant une interaction plus profonde et plus nuancée avec les utilisateurs.

C'est donc ici une amélioration profonde qui devrait encore améliorer les performances de Chat GPT. Bien sûr, nous ne sommes pas encore sur une base d'informations en "temps réel", mais force est de constater qu'ils ont grandement rattrapé le retard en termes de traitement de données, ce qui laisse présager des réponses plus cohérentes et des possibilités encore plus étendues.

Côté tarification, GPT-4 Turbo devient beaucoup plus accessible avec une réduction significative des coûts, une initiative qui devrait ravir les développeurs et les entreprises. Les tokens d'entrée sont désormais facturés 0,01 dollar pour mille tokens, et les tokens de sortie à 0,03 dollar pour mille, soit une baisse de prix qui les rend trois fois et deux fois moins chers respectivement par rapport au tarif antérieur du GPT-4.

Les fonctionnalités de ce modèle ont également été affinées, notamment au niveau de l'appel de fonctions. Il est maintenant possible d'invoquer plusieurs fonctions dans un seul message, d'assurer un retour de fonctions valides en mode JSON et de bénéficier d'une précision améliorée pour le renvoi des bons paramètres de fonction.

Le modèle promet également des sorties plus déterministes grâce à la nouvelle fonctionnalité beta de sorties reproductibles. Les utilisateurs peuvent dès à présent accéder à GPT-4 Turbo en passant par l'identifiant gpt-4-1106-preview dans l'API, avant la sortie d'une version stable et prête pour la production plus tard dans l'année.

GPT-3.5 Turbo se met à jour

OpenAI a également mis à jour son offre avec le lancement du nouveau gpt-3.5-turbo-1106, une version améliorée qui prend en charge par défaut une fenêtre de contexte de 16 000 jetons, offrant ainsi une capacité de compréhension quatre fois plus longue que les modèles précédents. Cette extension du contexte s'accompagne d'une baisse des tarifs, rendant le modèle plus accessible à $0,001 pour mille jetons d'entrée et $0,002 pour mille jetons de sortie.

En outre, la version affinée de GPT-3.5 devient nettement plus économique : les prix des jetons d'entrée chutent de 75 % à $0,003 pour mille, tandis que ceux des jetons de sortie diminuent de 62 % à $0,006 pour mille, ce qui représente une économie substantielle pour les développeurs et entreprises utilisant ce modèle.

Le gpt-3.5-turbo-1106 s'aligne sur les avancées du GPT-4 Turbo, notamment en ce qui concerne l'amélioration de l'appel de fonctions et la disponibilité de sorties reproductibles, des fonctionnalités qui renforcent la cohérence et la fiabilité des interactions avec l'IA. Ces améliorations ouvrent la voie à une utilisation encore plus étendue de l'IA dans diverses applications, tout en conservant une structure de coût compétitive.

La promesse d'une interaction humain-machine toujours plus fluide et intuitive se concrétise avec la présentation de la version bêta de la nouvelle Assistants API d'OpenAI. Conçue pour simplifier l'intégration d'expériences d'agents conversationnels dans les applications, cette API propose une gamme d'utilisations aussi large qu'innovante : depuis les applications d'analyse de données en langage naturel, jusqu'aux assistants de codage, en passant par la planification de vacances assistée par intelligence artificielle et même des DJ contrôlés par la voix.

Au cœur de cette avancée, l'API offre la possibilité de créer des assistants AI spécialisés, capables de suivre des instructions précises, de tirer parti de connaissances supplémentaires et d'interagir avec divers modèles et outils pour accomplir une multitude de tâches.

Les développeurs bénéficient désormais de Threads persistants, une innovation permettant de déléguer la gestion de l'état des discussions à OpenAI, contournant ainsi les restrictions liées à la fenêtre de contexte de l'IA. Avec des outils tels que l'interprétation de code, la récupération de données et l'appel de fonctions, cette API ouvre la voie à une plus grande adaptabilité et personnalisation. De plus, la plateforme Playground d'OpenAI offre la possibilité de tester l'API sans écrire une ligne de code, permettant ainsi aux développeurs de tous niveaux de découvrir et d'expérimenter les capacités de ces assistants AI avancés.

Capacités multimodal améliorées

Désormais, la puissante API de Chat Completions prend en charge les entrées visuelles, ouvrant la voie à des applications telles que la génération automatique de légendes pour des images et l'analyse visuelle poussée. Les développeurs peuvent d'ores et déjà accéder à ces fonctionnalités en utilisant le modèle gpt-4-vision-preview. Cette capacité de vision, actuellement en phase de prévisualisation, sera pleinement intégrée à la version finale de GPT-4 Turbo plus tard dans l'année.

Au-delà du visuel, OpenAI étend l'immersion multimodale avec l'intégration de DALL·E 3, permettant la génération d'images via l'API de génération d'images. Cette fonctionnalité ouvre de nouveaux horizons en termes de créativité et d'applications personnalisées.

Enfin, l'expérience sensorielle s'enrichit grâce à la récente capacité de synthèse vocale du modèle TTS (Text-to-Speech). Ce nouveau modèle peut lire des textes à haute voix en utilisant l'une des six voix naturelles disponibles, rendant l'interaction avec l'IA encore plus naturelle et accessible. La synthèse vocale vient compléter l'ensemble multimodal, en offrant une dimension sonore aux interactions déjà riches permises par GPT-4 Turbo.

Personnalisation de ChatGPT

ChatGPT se dote d'une nouvelle fonctionnalité de personnalisation, permettant de créer une expérience utilisateur spécifique à des besoins particuliers.

Cette fonctionnalité innovante permet aux développeurs de fusionner instructions, données et capacités dans une version sur mesure de ChatGPT, adaptée à des besoins spécifiques. Outre les capacités préexistantes comme DALL·E pour la création d'images ou les outils d'analyse de données avancée, les GPTs ouvrent la possibilité d'intégrer des actions définies par les développeurs eux-mêmes, élargissant ainsi le champ des expériences utilisateur personnalisables.

L'architecture sous-jacente a été conçue pour que plugins et actions soient très similaires, rendant la transformation d'un plugin existant en une action rapide et intuitive, souvent en quelques minutes seulement. Cette approche modulaire et hautement adaptable promet de révolutionner la manière dont les développeurs interagissent avec l'IA, leur donnant le contrôle de l'expérience utilisateur de bout en bout. Pour ceux qui souhaitent en savoir plus, OpenAI met à disposition une documentation détaillée, soulignant l'engagement de l'entreprise à faciliter l'accès et la compréhension de ces outils puissants.

En tant que développeur et grand fan de technologie, je dois avouer que je suis vraiment fasciné par la puissance et les possibilités offertes par l'intelligence artificielle. Les outils d'OpenAI ont clairement révolutionné le domaine et laissent entrevoir des possibilités impressionnantes pour les années à venir. Plus encore, je constate qu'OpenAI a réellement pris une longueur d'avance, et je ne suis pas certain que, à l'heure actuelle, les géants tels que Google, Apple ou encore Meta puissent rivaliser.

Je suis très curieux de voir comment les choses vont évoluer dans le domaine de l'IA. En tout cas, je suis persuadé qu'il y a encore de belles surprises en réserve.