TrueSkill: Comment Halo 5 correspond aux joueurs

Nous ne pensons souvent pas aux jeux multijoueurs en ligne comme ayant des difficultés de la même manière que les jeux à un seul joueur et nous ne les maintenons généralement pas au même niveau quand il s’agit de régler cette difficulté. Cependant, je dirais que nous devrions. Un match en ligne où nous n’avons pas les compétences pour concurrencer peut être tout aussi frustrant qu’un niveau de campagne solo trop pénalisant. La différence est que, dans l’expérience en solo, nous pouvons réduire la difficulté et dans un match multijoueur local, nous pouvons même être en train de discerner nos adversaires, mais dans les parties multijoueurs, nous sommes à la merci des systèmes de jumelage. . Pour cette raison, la mise en correspondance précise des joueurs est un aspect essentiel des jeux multijoueurs en ligne, et les algorithmes de mise en relation devraient être en mesure d’ajuster correctement les difficultés ainsi que, sinon mieux, que nous. Toute la conception réfléchie de la carte et du gameplay dans le monde n’a pas d’importance si nous ne jouons pas là où nous avons le sentiment que nous pourrions réussir si nous essayions assez.

En dépit de leur nature de piliers de la compétition en ligne, nous ne parlons pas beaucoup des systèmes de jumelage dans les discussions sur les jeux traditionnels. C’est en partie parce que le problème est sec et se pose souvent en territoire mathématique académique, mais c’est aussi parce que nous ne voyons pas le code derrière ces mécanismes. Nous pouvons nous demander si la correspondance est juste ou injuste, mais nous ne pouvons pas nous interroger sur les raisons de cette amélioration ou de son amélioration, sauf dans le cas des jeux basés sur TrueSkill, et particulièrement dans Halo 5. Microsoft n’a été que trop heureux de publier publiquement les détails du fonctionnement de leurs logiciels, car s’ils peuvent enseigner à de nombreux programmeurs émergents comment se développer avec les technologies Microsoft, ces ingénieurs logiciels aideront à soutenir les plates-formes Microsoft du futur. Ensuite, il y a 343 Industries qui comprend que Halo a une communauté exigeante qui aspire à une interaction directe avec les développeurs des jeux et parle donc haut et bas de la manière dont elle correspond aux joueurs.

Entre les contributions de Microsoft et de 343, de nombreux documents disponibles sur TrueSkill et TrueSkill2 sont disponibles en ligne, mais pas sous une forme où la plupart des acteurs sont susceptibles de reconstituer le fonctionnement global de ces systèmes. Vous avez probablement déjà entendu parler de TrueSkill: c’est un algorithme breveté pour le classement des joueurs de jeux vidéo, développé par Microsoft mais utilisé par de nombreuses autres sociétés, de Blizzard à Epic. TrueSkill2 est son successeur, celui qui vise à améliorer son grand frère, mais jusqu’à présent, il n’a été déployé que pour Gears of War 4 et Halo 5. Nous allons examiner ces deux systèmes pour découvrir comment Microsoft fait correspondre les joueurs sans besoin de connaître les mathématiques avancées ou l’histoire des algorithmes de jumelage.

Nous pouvons avoir un aperçu complet de la façon dont ces systèmes fonctionnent à partir de deux sources seulement. Le premier d’entre eux est les publications de Josh Menke, le concepteur principal d’engagement chez 343 Industries. C’est le travail de Menke qui consiste à accorder le match de Halo 5, et il a posté des mises à jour presque hebdomadaires sur l’appareil de correspondance des joueurs sur les forums de Waypoint. Il a également répondu à presque tous les utilisateurs qui interagissent avec lui sur les forums ou sur Twitter. C’est un engagement extraordinaire d’un designer dans un studio de jeu de titan pour communiquer avec ses joueurs et répondre aux critiques. Les publications de Menke sont utiles dans ce contexte car il précise comment Halo 5 prend les données du système de classement de Microsoft et les utilise pour faire correspondre les joueurs. Pour savoir comment Microsoft génère ces chiffres, nous pouvons d’abord attirer notre attention sur un document de recherche publié en mars 2018 par la société et intitulé «TrueSkill 2: un système d’évaluation bayésien amélioré».

Avant de discuter du fonctionnement de TrueSkill, utilisons ces ressources pour expliquer comment cela ne fonctionne pas. Les profils dans Halo 5 affichent un mérite appelé Classement des compétences concurrentielles ou RSE. Dans chaque playlist, chaque saison, vous devez jouer dix matches et, en fonction de ces matches, le jeu vous classe dans une ligue et vous classe dans cette ligue, en vous attribuant une CSR comme “Silver 6” ou “Diamond 1”. Chaque fois que vous gagnez un match, vous vous rapprochez de la promotion au rang suivant, et lorsque vous en perdez un, vous vous rapprochez de la rétrogradation. Lors du premier dévoilement de la RSE, ils ont donné l’impression que ce serait la mesure utilisée pour faire correspondre les utilisateurs et que certains points de vente la signalaient de manière incorrecte. J’ai fait la même erreur.

Il est facile d’avoir l’impression que le jeu regroupe des équipes via la RSE car c’est le seul classement que montre Halo 5, le jeu ne l’affiche que dans le mode classé et vous combattez généralement les joueurs à peu près au même niveau. Si vous pensiez que le système de matchmaking dépendait de la RSE, vous étiez probablement très déçu car la RSE était loin d’être une mesure infaillible de la performance des joueurs. Après vos matchs de placement, il n’a jamais répondu aux performances de vos équipes dans les jeux et n’a jamais été une réflexion individuelle de votre performance en tant qu’individu. Vous pouvez toujours affirmer que, en tant que signifiant tourné vers l’extérieur, il est défectueux, mais comme le confirme Menke, la RSE ne fait pas partie de TrueSkill et n’a jamais été utilisée pour classer les joueurs, même si placement.

Alors, comment un titre comme Halo 5 vous correspond-il? La réponse simple est la suivante: TrueSkill vous attribue un numéro pour représenter votre compétence au jeu, mais elle est cachée à tout le monde sauf aux ingénieurs. Ce numéro est désigné par la communauté comme MatchMaking Rank ou MMR. Le marieur de Halo compile ensuite deux équipes adverses ou plus de telle sorte que le MMR total d’une équipe correspond à peu près au total du MMR. Il essaie également de s’assurer que chaque joueur d’une équipe a un MMR similaire à tous les autres. À la fin des matchs, TrueSkill ajuste votre MMR selon que vous avez gagné ou perdu. Il considère également combien de temps vous avez passé dans le jeu lorsque vous avez décidé du nombre de points sur lesquels vous souhaitez décaler votre MMR. les allumettes plus longues comptent davantage dans votre MMR alors que les allumettes plus courtes comptent moins que les secondes. Cependant, comme nous l’avons mentionné, les gains et les pertes que les études de TrueSkill n’ont pas permis de mesurer les capacités. Le papier TrueSkill2 admet autant.

Dans le document, les chercheurs discutent de certains facteurs pertinents que TrueSkill ne prend pas en compte lors de l’évaluation des utilisateurs. Par exemple, l’algorithme ne considère pas les attaques de joueurs, il ne reflète pas le fait que les joueurs dans les équipes peuvent obtenir de meilleurs résultats que ceux sans équipes, et cela ne tient pas compte du fait que les compétences des utilisateurs Je ne suis pas connecté depuis un moment. Cela suppose également que la capacité d’une personne à diminuer avec le temps augmente aussi, ce qui est fallacieux quand on sait que plus de pratique rend les joueurs meilleurs. De plus, l’algorithme ne traite pas correctement les renonceurs. Lorsque vous quittez un match, TrueSkill met à jour votre MMR selon que votre équipe a gagné ou perdu, mais si vous avez quitté le match, vous n’avez probablement pas beaucoup contribué à cette victoire ou à cette perte et vous ne devriez pas en être crédité. . De nombreux utilisateurs quittent les matchs défavorables dans les premières secondes et ne peuvent être tenus responsables du résultat. Nous pouvons voir que TrueSkill avait besoin d’une mise à niveau, et Microsoft l’a prouvé dans la recherche. En comparant les prédictions de résultats de correspondance de TrueSkill avec les résultats de correspondance réels, Microsoft a objectivement affiché un certain nombre de domaines dans lesquels l’algorithme a échoué dans ses tâches prédictives.

Par exemple, il est possible de prédire que les joueurs en équipes de quatre personnes gagneraient 5% moins de matches qu’ils ne l’avaient fait. TrueSkill a également légèrement surestimé les compétences des joueurs nouveaux dans le jeu et son manque de modélisation KPM (Kills Per Minute) a servi de point critique. Microsoft a constaté que les écarts dans KPM représentaient une différence allant jusqu’à 13% dans les taux de gains des joueurs lorsque TrueSkill supposait qu’un joueur avec un KPM élevé aurait une différence de fréquence de gain de 2% avec un KPM faible. Les joueurs très bas de gamme et haut de gamme ont été les plus mal jugés par l’algorithme; il a prédit que ceux qui ont marqué 0,0-0,4 KPM gagneraient 5% de plus qu’eux, alors que ceux qui ont marqué 2,8-4,0 KPM gagneraient 5 à 9% de moins qu’eux. Rappelez-vous, lorsque l’algorithme sous-estime la probabilité de gagner de quelqu’un, ce joueur va se regrouper avec d’autres qui sont trop faibles pour son niveau de compétence et quand l’algorithme surestime la probabilité de gagner, il sera groupé avec les joueurs. trop élevé pour leur niveau de compétence. En d’autres termes, TrueSkill a toujours été à vos côtés avec des joueurs surpuissants ou peu puissants, tant dans les équipes adverses que dans votre équipe. Cela a exercé une pression indue sur les autres joueurs pour qu’ils puissent jouer au-delà de leurs moyens, soit pour se défendre contre des adversaires bien plus puissants qu’eux, soit pour compenser le retard des Spartans dans leur équipe.

Il existe d’autres exemples de différences entre les prédictions et la réalité de TrueSkill, mais leurs effets sur le MMR sont assez subtils pour ne pas nous inquiéter. Bien sûr, lorsque TrueSkill ne correspond pas exactement à deux équipes, le résultat du match ne reflète pas fidèlement leurs compétences. La mise à jour de leur MMR en fonction de leur victoire ou de leur défaite est donc inexacte. Après un faux ajustement MMR, les joueurs participants sont plus susceptibles d’être incompatibles avec les autres joueurs, qui peuvent alors connaître la même mise à jour erronée de leur MMR car le match n’est pas juste et le problème commence à polluer le pool entier. Microsoft ne mentionne pas cela dans le papier; c’est juste une observation personnelle. Dans l’ensemble, les chercheurs ont déclaré que TrueSkill avait 52% de chances de prédire correctement le résultat d’un match.

Lorsque vous calculez les chiffres, TrueSkill2 prend en compte un grand nombre des facteurs manquants que TrueSkill n’a pas, y compris les quittes, les tués au fil du temps et si les joueurs font partie d’une équipe. Cela suppose également qu’un joueur soit susceptible de s’améliorer au fur et à mesure que le nombre de matchs joués augmente, et que la situation empire au fur et à mesure de son éloignement. Dans leurs recherches, Microsoft démontre sans équivoque que TrueSkill2 est supérieur à TrueSkill dans chacun de ces domaines. Bien que, pour ce que cela vaut, ils ont trouvé que l’algorithme est un peu trop zélé dans le dé-classement des abandonneurs. En travaillant sur le même jeu de données qu’il a testé sur TrueSkill, TrueSkill2 a démontré un taux de réussite de 68% pour prédire les résultats des correspondances. Cette augmentation de 16% peut ne pas sembler beaucoup, mais le designer Josh Menke le décrit comme l’un des plus grands sauts qu’il a vu sur le terrain. Lorsque le système a été implémenté dans les listes de jeux sociaux et de guerre de Halo 5 à la mi-avril 2018, Menke a rapporté que la prévisibilité des matches était à peu près parfaite et que les 10% des joueurs ayant déjà un taux de 50%.

Les joueurs ayant un taux de victoire de 50% sont l’idéal, et cela peut sembler être le cas pour les concepteurs qui limitent artificiellement votre capacité à gagner, mais le taux de victoire va toujours descendre à un certain pourcentage et le jeu ne vous oblige pas à gagner. ou perdre dans un match individuel. C’est seulement lorsque les équipes sont uniformément réparties au fil du temps que la fréquence de victoire de chacun doit être ramenée à une moyenne de 50%. Bien que TrueSkill vous lie au succès de votre équipe, au risque d’ignorer les aptitudes que vous avez personnellement affichées, TrueSkill2 tient compte de vos performances en tant qu’individu et en tant que membre d’une équipe. Sous l’œil vigilant du nouvel algorithme, il est possible de perdre un match et d’augmenter votre MMR si vous avez affiché des prouesses au combat, et que votre équipe sous-équipée devient moins une source de risque pour votre classement MatchMaking.

Avec un test réussi, 343 a implémenté TrueSkill2 dans les listes de lecture classées de Halo 5 au début du mois de mai 2018, marquant le début de la saison été 2018. Quelques semaines plus tard, ils ont appliqué une mise à jour pour lier plus étroitement la RSE au MMR généré par TrueSkill2, ce qui en fait une mesure de compétence plus juste. J’aurais aimé pouvoir dire “Tout va bien, ça se termine bien”, mais il y a quelques fils en vrac. Il était désagréable de supporter près de trois ans de matchmings déséquilibrés dans Halo 5, et bien que Menke n’ait été que l’adaptation sur les réseaux sociaux, je souhaiterais que 343 facilitent la formation au Néanmoins, Halo 5, Gears et, espérons-le, beaucoup d’autres jeux en ligne multijoueurs sont indispensables. Et à quelle fréquence voyez-vous tous les calculs et les raisonnements d’une technologie de jeux de pointe qui vous sont offerts gratuitement? Nous sommes très chanceux d’avoir TrueSkill de notre côté. Merci d’avoir lu.