Les chatbots IA arrivent massivement sur les navigateurs Web

[ad_1]

Les assistants IA sont en train de devenir la plus grande chose dans les navigateurs depuis l’invention de l’onglet. Les entreprises, grandes et petites, recherchent des moyens d’intégrer les chatbots dans votre expérience, mais aussi d’aller encore plus loin. Bientôt, votre navigateur pourra peut-être modifier automatiquement l’apparence et le fonctionnement d’une page et même réécrire les mots de la page en fonction de vos besoins particuliers.

L’une des implémentations les plus ambitieuses que j’ai vues provient d’une société appelée SigmaOS, qui se présente comme un navigateur pour l’ensemble ultra-productif. Il dispose de nombreux outils d’organisation et d’idées vraiment farfelues sur les raccourcis clavier et la gestion des onglets – et maintenant, il lance un nouvel assistant AI appelé Airis qui fonctionne sur tout le navigateur. (Cela se prononce comme « iris » mais avec l’IA, parce que vous devez avoir l’IA, vous savez ?) Ce qu’Airis fait, essentiellement, c’est vous permettre de poser des questions sur une page Web. Vous pouvez mettre en surbrillance un nom ou une phrase, cliquer avec le bouton droit de la souris et sélectionner « demander à Airis » pour rechercher ce que vous avez sélectionné. Il tente ensuite d’expliquer ce nom, ce concept, cette phrase ou quoi que ce soit dans le contexte de la page que vous consultez.

Si je demandais, par exemple, à ChatGPT qui est Nikola Jokić, j’aurais un aperçu de la superstar serbe de la NBA. Mais quand j’ai interrogé Airis sur Nikola Jokić dans une histoire ESPN prévisualisant la finale de la NBA, il m’a dit que « l’auteur explique comment le pick-and-roll de Jokic avec Jamal Murray est une combinaison presque imparable ». Il existe de nombreuses façons basées sur l’IA de résumer une page Web, mais celle-ci le fait dans le contexte exact que je recherche. Je peux également poser des questions de suivi à Airis – qui, selon cet auteur, va gagner le championnat ? – et obtenir des réponses.

L’assistant Airis fait un travail impressionnant pour comprendre une page Web et répondre aux questions à ce sujet.
Image : SigmaOS / David Pierce

« Je n’ai pas besoin d’écrire une invite ChatGPT massive et complexe disant que je veux créer un Arrabbiata », déclare Mahyad Ghassemibouyaghchi, PDG de SigmaOS. « Je peux juste demander. Vous connaissez déjà le contexte, je n’ai pas besoin d’en faire plus.

Parce que le navigateur connaît la page que je regarde, il peut déduire une énorme quantité d’informations à partir d’une simple invite. La façon dont Ghassemibouyaghchi décrit la technologie d’Airis est simple et intelligente : elle ingère et comprend rapidement les parties importantes d’une page Web, associe ces informations à votre question pour former une invite complexe, envoie cette invite au grand modèle de langage GPT-4 d’OpenAI, puis remonte les réponses. Vous n’avez pas à faire d’ingénierie rapide car votre question et la page Web contiennent plus qu’assez d’informations.

Comme il l’explique, Ghassemibouyaghchi me montre une démo d’Airis qui consiste à résumer les quatre points principaux d’un article d’entreprise réfléchi et à extraire les ingrédients d’une très longue page de recette. « Ce que nous faisons, c’est l’examiner avec notre algorithme, construire une hiérarchie et dire : ‘D’accord, quelles sont les parties les plus importantes que cette personne doit comprendre ?’ C’est comme essayer d’expliquer à un enfant de cinq ans : vous devez donner les informations simples les plus importantes, mais n’omettez rien d’important.

Airis peut également vous aider à modifier et à réécrire du texte, comme les outils Google Duet et Microsoft Copilot, mais comme il est intégré à un navigateur, il fonctionne avec n’importe quelle zone de texte sur Internet. Il peut même réécrire des pages Web existantes : à un moment donné de notre démo, Ghassemibouyaghchi charge la page Wikipédia pour les « guerres de navigateurs » et clique sur un bouton de menu intitulé « Simplifier ». La page a soudainement commencé à se transformer et à changer, rétrécissant de façon assez spectaculaire pour en faciliter la lecture. Comme toutes les démos d’Airis, ce n’était pas parfait ; il a laissé tomber quelques détails importants et transformé quelques phrases en charabia. Le produit fini était également encore assez long. Mais il a plus ou moins fait le travail.

SigmaOS est loin d’être la seule entreprise à chercher des moyens d’associer l’IA à votre expérience de navigation. Microsoft ajoute une barre latérale Bing à son navigateur Edge, mettant à la fois la recherche et les chatbots en un clic, et il déploie également des outils que vous pouvez utiliser pour résumer ou réécrire des pages Web. Opera a récemment lancé ses propres outils de réécriture et de résumé, ainsi qu’une barre latérale dédiée pour accéder à ChatGPT et à d’autres bots.

La nouvelle barre latérale Edge concerne l’accès facile à l’IA.
Image : Microsoft

Les navigateurs vont être un endroit important pour les outils d’IA en partie simplement parce qu’ils sont si populaires. Surtout sur les ordinateurs de bureau et les ordinateurs portables, la plupart des utilisateurs passent la plupart de leur temps dans un navigateur. Si vous créez simplement un chatbot facilement accessible comme Microsoft le fait avec la nouvelle barre latérale Edge, il y a de fortes chances que les gens le trouvent.

Mais les navigateurs ont également un accès inégalé à tout ce que vous faites, lisez, regardez, regardez et tapez sur le Web. Cela signifie que l’IA au niveau du navigateur pourrait être plus performante que presque n’importe quel autre outil. « Vous devez pouvoir passer facilement d’un service à l’autre », explique Krystian Kolondra, vice-président exécutif des PC et des jeux d’Opera. « Prenez cette feuille de calcul, faites-en une présentation avec l’IA. Tous les services sont disponibles via le navigateur, et l’IA pourrait être un ciment. »

C’est plus facile à dire qu’à faire, cependant. Il existe d’énormes problèmes de confidentialité lorsqu’il s’agit d’envoyer votre historique de navigation à GPT-4 ou à tout autre modèle, sans parler des coûts encourus chaque fois que vous dites : « Rendez cette page Web massive plus courte ». Le Web est rapide, mais l’IA est lente, ce qui est un problème d’interface utilisateur délicat. Et comme apparemment chaque moteur de recherche et application adopte ses propres fonctionnalités d’IA, comment les bots interagissent-ils les uns avec les autres ?

Réinventer le navigateur est également un travail difficile. (Rappelez-vous à quel point les gens ont paniqué quand Apple a déplacé la barre d’URL Safari du haut de l’écran vers le bas ?) Mais c’est un moment propice pour l’innovation. Les dernières années de travail à domicile pandémique ont redonné de l’importance aux PC, et les navigateurs de bureau sont l’application la plus importante sur les ordinateurs de la plupart des gens. Les développeurs et les régulateurs sont de plus en plus frustrés par les magasins d’applications et la vie multiplateforme, ce qui signifie que les applications Web connaissent un moment. Et peut-être plus que tout, les fabricants de navigateurs réalisent enfin que la gestion de tous vos onglets est nulle et qu’ils doivent faire quelque chose à ce sujet.

Il reste encore beaucoup à comprendre, mais l’IA semble pouvoir finalement tout changer dans le fonctionnement des navigateurs. Pendant tant d’années, les navigateurs se sont ressemblés pratiquement quelle que soit l’application que vous utilisez : une rangée d’onglets carrés en haut, une grande barre d’adresse en dessous, peut-être quelques extensions à droite, une rangée de signets en dessous. Boutons Précédent, Suivant, Actualiser. Pas grand-chose d’autre. Mais maintenant, alors que l’IA connecte les services et fonctionne à travers eux, nos relations avec nos onglets peuvent être sur le point de changer.

[ad_2]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*