Twitter prend son algorithme « open-source », comme l’a promis Elon Musk

[ad_1]

Twitter a publié le code qui choisit les tweets qui s’affichent sur votre chronologie sur GitHub et a publier un article de blog expliquant la décision. Il décompose ce que l’algorithme examine lorsqu’il détermine quels tweets doivent figurer dans la chronologie For You et comment il les classe et les filtre.

Selon le blog de Twitter, « le pipeline de recommandations est composé de trois étapes principales ». Tout d’abord, il rassemble « les meilleurs Tweets de différentes sources de recommandation », puis il classe ces tweets avec « un modèle d’apprentissage automatique ». Enfin, il filtre les tweets des personnes que vous avez bloquées, les tweets que vous avez déjà vus ou les tweets qui ne sont pas sûrs pour le travail, avant de les mettre sur votre chronologie.

Le message approfondit également chaque étape du processus. Par exemple, il note que la première étape examine environ 1 500 tweets et que l’objectif est de faire en sorte que la chronologie For You soit composée d’environ 50 % de tweets de personnes que vous suivez (appelées « In-Network ») et de 50 % de tweets. à partir de comptes « hors réseau » que vous ne suivez pas. Il indique également que le classement est destiné à « optimiser pour un engagement positif (par exemple, J’aime, Retweets et Réponses) », et que la dernière étape essaiera de s’assurer que vous ne voyez pas trop de tweets de la même personne.

Bien sûr, le plus de détails seront disponibles en choisissant le code, qui les chercheurs font déjà.

Le PDG Elon Musk promet cette décision depuis un certain temps – le 24 mars 2022, avant de posséder le site, il a interrogé ses abonnés pour savoir si l’algorithme de Twitter devrait être open-source, et environ 83 % des réponses ont répondu « oui ». En février, il a promis que cela arriverait d’ici une semaine, avant repousser l’échéance au 31 mars plus tôt ce mois-ci.

Musk a tweeté que la publication de vendredi était « la majeure partie de l’algorithme de recommandation », et a déclaré que le reste serait publié à l’avenir. Il a également déclaré que l’espoir est « que des tiers indépendants soient en mesure de déterminer, avec une précision raisonnable, ce qui sera probablement montré aux utilisateurs ». Dans un espace discutant de la publication de l’algorithme, il a déclaré que le plan était d’en faire «le système le moins jouable sur Internet» et de le rendre aussi robuste que Linux, peut-être le projet open source le plus célèbre et le plus réussi. « L’objectif global est de maximiser les minutes utilisateur non regrettées », a-t-il ajouté.

Le musc a été préparer son public à être déçu dans l’algorithme quand ils le voient (ce qui suppose, bien sûr, que les gens comprendront réellement le code complexe). Il a dit c’est «trop complexe et pas entièrement compris en interne» et que les gens «découvriront beaucoup de choses idiotes», mais a promis de résoudre les problèmes au fur et à mesure qu’ils seraient découverts. « Fournir la transparence du code sera incroyablement embarrassant au début, mais cela devrait conduire à une amélioration rapide de la qualité des recommandations », a-t-il tweeté.

Il y a une différence entre la transparence du code, où les utilisateurs pourront voir les mécanismes qui choisissent les tweets pour leurs chronologies, et le code étant open-source, où la communauté peut en fait soumettre son propre code pour examen, et utiliser l’algorithme dans d’autres projets . Alors que Musk a a dit ce sera open source, Twitter devra réellement faire le travail s’il veut gagner ce label. Cela implique de trouver des systèmes de gouvernance qui décident quelles demandes d’extraction approuver, quels problèmes soulevés par les utilisateurs méritent l’attention et comment empêcher les mauvais acteurs d’essayer de saboter le code à leurs propres fins.

Twitter dit que les gens peuvent soumettre des demandes d’extraction qui pourraient éventuellement se retrouver dans sa base de code

L’entreprise dit qu’elle travaille là-dessus – le fichier Lisez-moi pour le GitHub dit « nous invitons la communauté à soumettre des problèmes GitHub et à tirer des demandes de suggestions sur l’amélioration de l’algorithme de recommandation ». Cependant, il poursuit en disant que Twitter est toujours en train de créer « des outils pour gérer ces suggestions et synchroniser les modifications apportées à notre référentiel interne ». Mais le Twitter de Musk a promis de faire beaucoup de choses (comme interroger les utilisateurs avant de prendre des décisions importantes) avec lesquelles il n’a pas collé, donc la preuve sera de savoir s’il accepte réellement un code communautaire.

La décision d’accroître la transparence autour de ses recommandations ne se fait pas dans une bulle. Musk a ouvertement critiqué la façon dont l’ancienne direction de Twitter gérait la modération et les recommandations, et a orchestré un déluge d’histoires qui il prétendait exposerait la «suppression de la liberté d’expression» de la plate-forme. (La plupart du temps, cela servait simplement à montrer comment fonctionne la modération normale du contenu.)

Mais maintenant qu’il est aux commandes, il a également dû faire face à de nombreuses réactions négatives – des utilisateurs agacés par leurs pages For You qui leur ont lancé ses tweets au visage, à ses partisans conservateurs de plus en plus préoccupés par le peu d’engagement qu’ils obtiennent. Il s’est disputé que le contenu négatif et haineux est « déboosté au maximum » dans les nouveaux algorithmes de recommandation du site, une affirmation contestée par des analystes extérieurs sans accès au code.

Twitter est également potentiellement confronté à une certaine concurrence de la part de la communauté open source. Mastodon, un réseau social décentralisé, gagne du terrain dans certains cercles, et le cofondateur de Twitter, Jack Dorsey, soutient un autre projet similaire appelé Bluesky, qui repose sur un protocole open source.


[ad_2]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*