スポンサーリンク

統計サイト「LoLalytics」でデータの間違った見方をしている人が多いので、正しく解説する

スポンサーリンク

© Lolalytics

とある海外の忍びが、統計サイト「LoLalytics」にはびこる間違ったデータの見方を正してくれると話題に。

LoLalyticsは、LoLの統計サイトの一つ。数ある統計サイトの中でも、かなりのデータが揃っており人気。

データを制する者はサモリフを制す

やぁ、みんな。

LoLalyticsのチャンピオン勝率について間違った見方をしている人がかなりの数いるので、正しく解説させてもらうよ。

LoLalyticsでは、「Asymmetric sampling」(非対称サンプリング)という手法でデータが収集されている。

これについて説明した後、みんながどのように間違って数字を見ているかを具体例を挙げて説明しよう。

 

非対称サンプリング

LoLalyticsに限らず、全てのLoLの統計サイトの勝率っていうのは、まず、レートの範囲を絞った情報が出ていることがほとんどだ。

例えば、LoLalyticsでは「エメラルド以上」がデフォルトの条件だよな。

 

LoLalyticsの特殊な点

例えば、デフォルト条件で14.2のルブランを見てみようか。

© Lolalytics

LoLalyticsでは、エメラルド以上のルブランが存在した試合に限り、「エメラルド以上」として記録する。

エメラルド以上のルブランがいたら、他の人のレートは無関係にエメラルド以上のルブランの試合データとして記録される。

……パッと考えると、データを集めるのに最適な方法のように見えるが、統計の基本的な知識がある人ならわかるはずだ。これには問題がある。

 

例1:勝率チェックの注意点

以下の要約:サイトの右上に常に表示されている「Average Emerald+ Winrate」が現在LoLalyticsが提供するエメラルド以上の全チャンピオンの平均勝率。必ずチャンピオンごとの勝率とここを比較する必要がある。チャンピオン勝率が50%を超えていれば強いというわけではない。

 

もう1度ルブランを見てくれ。「14.2では勝率がわずかに50%に行かないチャンピオンなんだな」くらいに思われるだろう。

© Lolalytics

しかし、右上に小さく書かれている「Average Emerald+ Winrate」の数字と比較する必要がある。ここに書かれているのが「全チャンピオンのエメラルド以上での平均勝率」なんだ。

さっきも言ったように、プラチナと対面したエメラルドのルブランは入っているが、エメラルドと対面したプラチナのルブランはデータに入っていない。

したがって、勝率が「ちょうどいい」ラインのチャンピオンの勝率は52.46%だということだ。ここが50%ではないのですでにここがややこしい。

「52.46%」と書かれているチャンピオンが実際には平均値であり、49.31%と出ているルブランはかなり弱いということだ。

これが小さく書かれていて、ほとんどの人はあまり見ない。実際、チャレンジャーのストリーマーでさえここを見ずに誤解しているのを見た。

 

例2:マッチアップ機能

LoLalyticsにはマッチアップ機能があるよな。各マッチアップのデータを出してくれる奴だ。

© Lolalytics

© Lolalytics

非対称サンプリングによってこういうことも起きる。

上の例を見たらすぐにわかるだろう。リリアとブライアー、「どっちがどっちに対しても有利」という矛盾したデータが出ている。

現在、素人がこのデータを使って正しく議論するのは不可能だ。よほど理由がない限りこのマッチアップ機能で議論したり考察するのは難しい。

 

例3:バフ・ナーフ機能

© Lolalytics

 

バフ・ナーフされたチャンピオンの勝率推移などを表する機能もある。

この記事を書くきっかけとなった機能だ。例えば99%の人がこの画像を見て、「チャンピオンの勝率がここからこんなに下がったんだ」と結論をだしてしまうだろう。

実際はどうだろうか……?

14.2の「Average Emerald+ Winrate」は52.46%。

一方、現在の14.3の同数字は50.53%。

すでに1.93%の下駄をはいているんだ。

 

非対称サンプリングがあるから、前のパッチと正確に比較するにはこの勝率には全て1.93%を加算する必要がある。

しかし、LoLalyticsはそれをしない。だから俺はこれはデータを害する悪質な表現だと主張させてもらう。

そして、パッチごとのエメラルド以上の勝率の変化は1.93%よりもはるかに大きいことが多いので、普段は余計に歪んだ結果になる。

もうこの機能は現状いらないと思う。

例えば、今回ナーフされたチャンピオンのうち、カルマやエズリアルは本当は勝率が上がっている(浅いプレイヤーがやめたからだと思われる)のに、この画像では下がっているように表示されているんだ。

 

まとめと結論

LoLalyticsは、多くの点から、LoLの統計サイトとしてはベストな選択肢だと言える。

しかし、このサイトはサンプリングの方法がかなり特殊だ。

俺のフレンド、Youtuber、ストリーマー。かなり多くの人がこのサイトの数字を間違って読み取り誤解している。

俺はそれを注意喚起したかったんだ。

 

これに対して、Redditでは以下のような反応が見られた。

反応

U.ggもLoLの統計サイト。
  • LoLalyticsはデータとしては最高のサイトだが、正しく読み取る能力は必須だ。
    • 実はとあるRioterが、「U.ggが一番俺たちの持っているRiot内部データに近い」と発言していた。

      LoLalyticsにはOPが解説してくれた問題があるからな。


      だがしかし、数年後になって、違うRioterが「LoLalyticsが一番俺たちの持っているRiot内部データに近い」と言い出したんだ。もうどっちが真実かわからん。

      • 最近のRioterはストリームではLoLalyticsを使っているよ。それに、U.ggは全試合のデータを参照していないしね。参照試合数が全然違う。

 

  • うーん、だれかマッチアップ機能をどうやって理解したらいいのか、わかりやすくしてくれないか?
    • マッチアップの勝率がどっち目線でも50%超えているというのは、OPの解説した理由と同じで、非対称サンプリングのせいだな。

      要するに、エメラルド+のリリアが戦ったら、相手のレートに関係なくデータに含まれてしまうということだ。かなり低レートと当たった試合でもデータに入る。


      こういうことがあるので、チャンピオンの勝率がお互いにプラスの数字になることがある。



      だが、LoLalyticsはマッチアップ理解のためにかなり優れたサイトだ。デルタ機能を使って勝率を平均化すれば、「誰がだれのカウンターなのか」が正確にわかる。

 

例:マッチアップの正しい分析方法

以下の要約:LoLalyticsのマッチアップで、Delta1とDelta2ともに正の値である場合、そのマッチアップは有利と言える。

例えば今、LoLalyticsで、ジャングルニダリーがジャングルリリアに対して勝率52%と出ているとしよう。

Delta1は2.69%。この意味は「ニダリーは他のチャンピオンより2.69%多くリリアに勝っています」ということ。今パッチでニダリーが全体的に強く、リリアが過剰にナーフされ気味であるところから来ているかもしれない。

しかし、Delta2を見てみよう。これは-1.42%だ。この意味は「今のニダリーのデータからすると、リリアに対してもっと1.42%余計に勝つ予想」ということ。「今のニダリーならこれくらい勝つはず」というデータに反しているのだ。

つまり、実際はニダリーはリリアに結構苦戦しているという理解が正しい。「勝率52%」というところだけを見ると、ニダリーはリリアのカウンターに見えるかもしれないが、そうではない。

 

本当に有利なマッチアップの時はどうなるかというと、ニダリーVSリー・シンを見てみよう。

勝率57.93%で、Delta1は7%でDelta2も3.5%。両方のDeltaが正になる。ここで初めて、「ニダリーはリー・シンに有利、イージーマッチアップ」ということがわかる。

 

  • LoLプレイヤーって統計に弱いよな。

    チャレンジャーの配信者でさえ「マスター+200試合で勝率60%」みたいな数字に文句を言っている。


    LoLalyticsは素晴らしいサイトだが、ほとんどのプレイヤーは正しく使えない。

 

  • 右上に平均勝率あったんか……。気づいてなかったわ。今度から見ます。

 


統計を正しく理解することで、カウンターやメタに対して正しい結論に近づくことは間違いない。読者諸賢の感想もぜひお聞かせ願いたい。

 

担当:いちずなイブリン

Source:Spreading Awareness: LoLalytics Winrate Data Can be Misleading

 

管理忍

都合の悪い数字はほっとうけい!ござる。

 

おすすめ関連記事

お前らの「統計的には弱いかもしれないけど、お気に入り」ビルドを教えてくれ
秘伝のビルドを公開する海外の忍びが話題に。
フラッシュはD or F:レート/地域ごとの最新統計結果
永遠の論争テーマに関する最新の統計が話題に。
【LoL】統計によると、一番メンタルが安定しているのはルルを使うプレイヤー
全アサシンの大敵、ルルプレイヤーのAFK率が最も低いことが話題に。
【LoL】統計によるとAFKランキング第一位はヤスオメイン
メインごとのAFKランキングが話題に。

コメント

  1. opggやuggで14.1の時とか勝率52%以上が沢山いるのに勝率50%未満が全然いなくて意味不明だったのが解決した
    いいなこのサイト

    29
    1
  2. 素晴らしい記事
    レルOTPだから関係ないが

    40
  3. いいんだよ
    俺達は雰囲気で統計サイトみてるんだから

    44
    4
    • 俺たちは雰囲気でlolをプレイしている

      24
      • このコメントは黄昏の帳でよく見えないでござる。ニンニン。
        1
        21
  4. このコメントは黄昏の帳でよく見えないでござる。ニンニン。
    9
    26
    • じっくり見てもあんま意味ないよなあ
      こういうビルドあるのか、とか見つけるのにはいいと思うけど、ティアリストやビルドごとの勝率にいくら詳しくなってもゲームに勝てるようにはならない多分

      3
      8
      • 知識を身に着けたうえで実践に活かすことができて初めて勝ちやすくなるんじゃないの?
        そうじゃないなら統計サイトに需要なんてないし、詳しくなるだけで勝てるようになるならチームアナリストなんて必要ないし。

        8
        1
  5. チャレンジャーの平均勝率調べたらパッチ毎に55%~58%あって草
    チャレは上いないもんな
    昔のカサンテとかフェイとかがチャレだと勝率高いって言われてたけど絶対このせいだろ

    38
    2
  6. 正直ちゃんと見れてなかったからありがたい。
    アイテム周りの正確な見方もあったら記事みたいな…(今は大体リーダーボードの上から10人漁って決めてる)

    11
    • 分かるわ。krとかeu最上位の人のビルドルーンサモスペ真似してる。

      4
      1
  7. delta1とかdelta2みたいな数字がどうやって出されてるか知りたいんだけどなんて検索すれば出てくるのか分からんので詳しいニキがいたら教えてください

    • このサイトのことは知らんけど、デルタって書くんだからどっちも回帰分析によって出た値ちゃうかな。
      前者がリリアとニダリー以外が勝率に影響しないと仮定したときのリリアとニダリーによる勝率への影響、後者がニダリー以外が勝率に影響しないと仮定したときのニダリーによる勝率への影響あたりやと思う。
      コンボピックの概念とか、レートによるミクロスキルの差とかどこまで考慮してあるかは知らんけど。

      11
      1
      • 回帰分析ちょっと詳しく見てきます。サンガツ

    • 普通に差分をΔ(デルタ)って言ってるんやろ。引き算ってことや。

      >大文字の「Δ」は、数学や物理学において、(微小な)差 (differential) を表す。(wikipedia デルタの説明より引用)

      何と何の引き算かはサイトにあるdelta1の右のハテナマークにカーソル合わせれば出る。

      9
      1
  8. こんなんどうでもいいから
    広告を踏まずに閲覧する方法を教えてくれ

    18
    17
    • つAdブロ

      20
      5
  9. delta2の説明がよく分からないゴン!

    • リリアには勝率こそ52%で勝ち越しているけどニダリーのポテンシャルからするともっと(+1.42%)勝ち越せるはずだから、リリアのカウンターというわけではない。
      みたいなやつやろ。数字は単純加算ではないだろうけど。

      17
      1
    • AのBに対するマッチアップで
      d1は「他チャンプの対B勝率と比べてどのくらい勝ち越してるか」
      d2は「Aの対他チャンプ勝率と比べてどのくらい勝ち越してるか」

      d1が+でd2が-なら「AはBが比較的苦手だが、AはクソOPなので他チャンプ使うよりマシ」
      d1が-でd2が+なら「AはBが比較的得意だが、Aはクソ雑魚なので他チャンプ使ったほうがマシ」

      103
      0
      • 横からだけどめっちゃわかりやすい
        ありがとう

      • ありがとうね
        ンチュを贈呈します♡

        18
        3
  10. なんで平均勝率が50パーセント超えてるんだ??と思うことがあったので、この説明で理解できた。

    deltaの値まで見ないとカウンターなのか分からないっていうのは知らなかったので今度から意識しよう

  11. もうルーンやアイテムはuggのプロビルドだけ見るようにしてる

  12. メジャイはめっちゃ勝率が高いアイテムって書いてあるから俺も毎試合メジャイを積んで勝ちまくるぞ!

    29
    • 勝ってる時にしか積まないから勝率が高いンゴねえ

      あとはGAもそうだね
      火力は足りてて死ななければ勝ちっていう状態の育ったキャリーしか積まないから勝率高い

      15
      2
      • 似たので言えばデスキャップ2、3手目とか、アーリーアイテムの欄にある妙に勝率高いアイテム(キル取って金稼いで積んでる)が挙げられる
        後そもそもレイトキャリーとかスケールするキャラは3コア以上のアイテムは必然的に勝率が高くなったり

  13. なんか変だなと思ってたんだよね こういうことか…
    アイテムごとの勝率とかもこれを踏まえて見なきゃだめだな

  14. 統計は難しいので放送大学で受講してみると良し

  15. ま、まぁ俺はわかってたけどね

    16
  16. ここでも勘違いしてる人多かったよね  
    u.ggのほうが見方が簡単だよ 

    2
    2
  17. 統計見てこれが強いんだ有利なんだーで終わらせずなんで強いのか、なんで有利なのかってのを考えると良いよね
    俺?ブロンズだよ

    26
  18. これは良記事

    15
  19. 勝ち越してる人が到達するレートでデータ取ってるから
    平均勝率も52%ぐらいになるってこと?

    • 本来なら勝利と敗北の数は同じだから全チャンピオンの勝率を平均すると50%になる
      けどレートで区切るとそれが歪む
      エメラルドのアーリとプラチナのオリアナが戦ってエメラルドが勝った場合、
      エメラルドの記録にはアーリ勝利1と記録されるけどオリアナの敗北1は記録されないから、
      勝利と敗北の数が合わなくなる

      結果エメラルド+は勝利1000回で敗北900回とか歪んだ数値になって平均勝率は52.6%になる

      逆にプラチナが勝った場合は敗北だけが記録されるけど、
      プラチナがエメラルドに勝つ可能性は低いからエメラルド+は勝利数の方が敗北数より多くなる

      26
      • あまりにもわかりやすい説明
        さては頭いいな?

    • Aチーム(勝ち)vs Bチーム(負け)

      エメラルド vs エメラルド
      エメラルド vs エメラルド
      エメラルド vs プラチナ
      プラチナ vs プラチナ
      プラチナ vs プラチナ

      試合の結果とメンバー構成が以上の場合、

      ALLRank勝率:50%
      エメラルド+:60%
      プラチナ :40%

      になるってこと。

    • 人口的にダイヤ<エメラルド<プラチナ
      実力はプラチナ<エメラルド<ダイヤ
      エメラルドは人数が多いプラチナ以下とマッチしやすく、勝率が大きく上昇する
      逆に人数の少ないダイヤとはマッチしにくく勝率の下降は少ない
      合算すると勝率が上昇する方が多いので勝率は52%になる

      チャレで考えると分かりやすい
      チャレは実力が最大かつチャレ以下としかマッチしないのでよりチャレの多いチームが勝ちやすい
      結果勝率が上がり58%とかになる

      10
    • 理解できた、皆ありがとう!

  20. lolanalじゃなくなったの?

    6
    7
  21. u.gg
    15分段階での各データ(ゴールド、経験値、キル数、…)
    正規化した勝率
    よりわかりやすくシンプル

    lolalytics
    他ロールのチャンプとの相性(敵味方両方)(これがでかい)
    より詳しいビルドパス
    マッチアップ毎のルーン・ビルド選択
    メインルーン毎のビルド・マッチアップ勝率
    ルーンシャード(アダプティブボーナスや体力等)勝率
    時間帯ごとの勝率(≒強い時間帯)
    ランク帯ごとの勝率グラフ
    正規化してない勝率

    こんな感じ

  22. アイアン帯ではカウンターがどうとか関係ない、そいつがうまいかどうかにかかっている

    7
    3
  23. 俺たちは雰囲気で統計サイトを眺めてるし、雰囲気でパッチノートも読んでる
    もちろん今日も俺たちは雰囲気でLOLをプレイしてる

  24. アイアンの勝率は45%
    でもアイアンイラオイは50%つまり超OP

    17
  25. > 非対称サンプリングがあるから、前のパッチと正確に比較するにはこの勝率には全て1.93%を加算する必要がある。
    これはおかしいのでは
    パッチ間で比較するなら平均勝率と対象勝率との割合を前後のパッチそれぞれで出して比較するのが正しいはず
    別パッチの平均勝率と対象勝率を単純に足し引きしてはいけない

    3
    1
    • 割合を足し算しちゃいけないわな

      3
      2
    • 言ってる事は正しいけど、足し引きでも問題ないと思うな。
      例えばOPの考えでいうと、
      patchAで平均勝率52% 個別勝率53%
      patchBで平均勝率50% 個別勝率51%
      どちらも平均より1%勝ち越していると見るのは直感的だし、言うほど間違っていない。

      あなたの計算だと、
      patchAは0.53/0.52=1.0193
      patchBは0.51/0.50=1.0200
      10193と10200を比べれば若干patchBの方が良い。みたいな話。
      言われりゃ確かにそうだが、精度は対して変わらない。
      もっと言うと割合の割合を考えてるから、更に一度直感的な数字に戻さないと使えない。(1.0200っていう数字がどのくらい良いのかが直感的に分かりづらい。)

      平均勝率に大きな差が出ないことを考えれば足し引きで問題ないと思う。

      8
      1
      • それは見当違いです

        > 非対称サンプリングがあるから、前のパッチと正確に比較するにはこの勝率には全て1.93%を加算する必要がある。
        これはあなたの出したパッチで考えると、50%(平均勝率A)-52%(平均勝率B)=-2%を51%(個別勝率B)に足して49%とすること
        これはおかしな計算で出た使えない数字

        同パッチの平均勝率と個別勝率の差を指標とするのは構いませんよ

        原文
        > Due to Asymmetric Sampling, we need to add 1.93% (52.46% – 50.53%) onto the current winrate of these champions if we want to compare them with winrates from last patch…

        2
        3
        • >これはあなたの出したパッチで考えると、50%(平均勝率A)-52%(平均勝率B)=-2%を51%(個別勝率B)に足して49%とすること
          私はpatchAの平均勝率を52%として、patchBの平均勝率を50%としたので逆です。
          なのでその2%をpatchBの個別勝率と足すと53%となります。

          >同パッチの平均勝率と個別勝率の差を指標とするのは構いませんよ
          同パッチの平均勝率との差を指標とするためにOPはこの作業をしています。
          なので、これを主張しつつOPの計算を否定するなら矛盾します。

          • 失礼しました

            計算については書いた段階でのミスですが、まずOPを勘違いしていたようです
            現パッチに値する勝率を導いたものだと考えていましたが、この計算で導いた53%は前パッチに値する勝率でしたね
            問題なく使えますし誤差も許容範囲ですね

  26. このコメントは黄昏の帳でよく見えないでござる。ニンニン。
    5
    21
    • 統計見てごちゃごちゃ言ってるやつより、プレイまくって自分で考えてるやつの方が勝率が高くなるのは対戦ゲームだとよく見るな
      統計見たところでプレイは上手くならんし、アイテムの実際の強さも体感できんからな

      3
      6
    • そうだな
      パッチが当たるたびに理想を探求できるくらいのプレイ時間があるならな

      13
      1
  27. 統計の勉強ができるなんてLoLは最高だな

  28. このコメントは黄昏の帳でよく見えないでござる。ニンニン。
    2
    18
  29. 最近自分でプレイせずデータを見て友人にアドバイスするのが楽しくなってきた

    4
    18
  30. ①Average Emerald+ Winrateと比較する必要がある
    ②マッチアップ機能はサクっと使う分にはゴミ
    ③①の値はパッチ毎に大きく変動する
    て理解でおけ?

    2
    1
    • 上の説明だとデルタとかで混乱するけどlolalytics見れば案外分かりやすいよ

      イーvsリーシンを例に挙げると

      Master Yi wins against Lee Sin 55.07% of the time which is 「5.35%」 higher against Lee Sin than the average opponent. After normalising both champions win rates Master Yi wins against Lee Sin 「1.18%」 more often than would be expected.

      1・イーはリーシンの(おそらくイー対面を除く)平均勝率より5.35%勝率が高い
      2・イーは予想より1.18%多くリーシンに勝っている

      マッチアップを確認するだけなら2、上の例なら1.18%の部分が+か-かだけを見ればいい。+なら有利で-なら不利。

      4
      1
  31. デルタ表示があるからlolalytics使ってる
    まじでわかりやすい

  32. すまんDelta1、Delta2の表示ってどこにある?

    • 自己解決したわ。チャンピオンページのPick/Banレートグラフの下にあるマッチアップ表のとこか

  33. 下手くそで勝率はアテにできないから「なぜ有利か?」「マッチアップでどういう立ち回りをすればいいのか?」をこういうサイトで教えてほしい…

    • トップレーンでレンジが強い理由とか分からんと勝てないしね
      ティーモで靴積まずに接近されて殴り合い負けるのとか当たり前のように見る

    • mobafireとかでマッチアップごとにこうしたら有利みたいとかこれは警戒しろみたいなの書いてくれてる人がいるからそれを見ると良い

  34. lol忍者結局広告は改善する気一切ないんだな対処するつって二か月放置しとるけど

    9
    1
  35. エメラルド+とか条件つけるとデータが偏るからall rankで見ればいいって話ではないの??