数学か表を扱える人に手伝ってほしい

  • 1二次元好きの匿名さん24/05/02(木) 16:48:37

    スレ建てるほどでもないと思ってたけど内容的に建てるべきだと判断した

    ・あるシリーズの人気投票があり、その内ある部門に絞った作品の順位(例えば「キャラクター部門ではどの作品が人気か」)を求めたい
    ・全部を纏めていては骨が折れるので、一定の順位内(範囲内)のもののみ集計する
    ・「同一作品からランクインしているものの最上位と最下位が何位か」「その作品だけで幾つ投票対象があるか」「そのうち幾つが範囲内にランクインしたか」が分かっている
    ・これらを用いてどういう計算をすれば求めたい答えが出せるか

    まず思い浮かんだのは中央値と平均の順位だけど、中央値は作品ごとに最上位と最下位の幅をがめちゃくちゃなのと、作品内の最下位が範囲外にあると意味がない、平均はふと校長を思い浮かべてアテにならないと思った
    次に思い浮かんだのは「作品から何割がランクインしてるか」を求めて他の数字とどうにかする方法だけど、具体的に何をしてどんな数値が出るのかわからなかった
    算数全然できないので助けてほしいです

  • 2二次元好きの匿名さん24/05/02(木) 16:53:52

    人気投票の結果を分析するには、いくつかの統計的手法が考えられます。ご提供いただいた情報に基づいて、以下のようなアプローチを取ることができます。

    1. **ランクの重み付け**: 各作品のランクインしたキャラクターに重みをつけて計算します。例えば、1位には大きな重みを、下位には小さな重みをつける方法です。これにより、高いランクのキャラクターが多い作品が高く評価されます。

    2. **ランクイン率**: 各作品のランクインしたキャラクターの割合を計算します。これは、作品内のキャラクター数に対するランクインしたキャラクター数の割合で、$$ \text{ランクイン率} = \frac{\text{範囲内にランクインしたキャラクター数}}{\text{作品内のキャラクター総数}} $$ と表せます。

    3. **平均ランク**: 範囲内にランクインしたキャラクターの平均ランクを計算します。ただし、これは範囲外のキャラクターがある場合には適切ではないかもしれません。

    4. **調和平均**: 平均ランクの代わりに調和平均を使用することもできます。これは、$$ \text{調和平均} = \frac{\text{ランクインしたキャラクター数}}{\sum_{i=1}^{n} \frac{1}{\text{ランク}_i}} $$ で計算され、高いランクのキャラクターにより大きな重みを与えます。

    5. **最上位と最下位の差**: 最上位と最下位のランクの差を利用して、作品の人気の広がりを評価することもできます。これは、作品の一貫性やキャラクター間の人気の差を示す指標になります。

    これらの方法を組み合わせたり、他の統計的手法を用いたりすることで、より総合的な評価が可能になります。どの方法が最も適切かは、求める結果の種類やデータの特性によって異なります。具体的な計算方法や結果の解釈については、さらに詳細なデータを元に検討する必要があります。お役に立てれば幸いです。📊

  • 3二次元好きの匿名さん24/05/02(木) 16:56:27

    このような問題を解決するためには、統計学の基本的な概念や手法を使うことが役立ちます。以下の手順で、求めたい答えを得ることができます。

    まず、各作品からランクインしている順位の範囲を計算します。これには、その作品の最上位と最下位の順位を用います。
    次に、その作品が投票対象として何個あるかを調べます。これが作品の総数です。
    そのうち、範囲内にランクインしている作品の数を数えます。
    最後に、範囲内にランクインしている作品の数を、総数で割って割合を求めます。これが、作品から何割が範囲内にランクインしているかを示します。
    具体的な計算手順を以下に示します。

    作品ごとの順位範囲を求める:各作品の最上位の順位と最下位の順位を用いて、その範囲を計算します。
    作品の総数を求める:投票対象となっている作品の総数を数えます。
    範囲内にランクインしている作品の数を求める:各作品の順位範囲が、求めている範囲内にあるかどうかを判断し、その数を数えます。
    範囲内にランクインしている作品の割合を求める:範囲内にランクインしている作品の数を、作品の総数で割って割合を求めます。
    これらの手順を順番に実行することで、求めたい答えを得ることができます。

  • 4二次元好きの匿名さん24/05/02(木) 16:58:55

    本当は重み付けするのが理想かな
    上に出てるやつね
    ただ初心者には難しいか?
    割合を求めるのが1番やりやすいかも
    順位の総数に対して作品別に何%入ってるか求めるとか

    全部の情報出せないのは分かるけど曖昧な情報だけだとここまでしか言えんかな

  • 5二次元好きの匿名さん24/05/02(木) 16:59:26

    もちろん、お手伝いします!シリーズの人気投票について、一定の順位内での作品の順位を求める方法を考えましょう。
    まず、以下の情報が分かっているということですね:
    同一作品からランクインしているものの最上位と最下位の順位
    その作品だけで幾つ投票対象があるか
    そのうち幾つが範囲内にランクインしたか

    これを用いて、一定の順位内での作品の順位を求める方法を考えてみましょう。

    作品ごとのランクイン数を計算する:
    各作品ごとに、範囲内にランクインしている順位の数を数えます。例えば、ある作品が1位から10位までの範囲内にランクインしている場合、その作品のランクイン数は10です。

    全作品のランクイン数を合計する:
    すべての作品のランクイン数を合計します。これにより、範囲内の作品の総数が分かります。

    作品ごとの投票対象数を計算する:
    各作品ごとに、投票対象となっている項目の数を数えます。これは、その作品の投票対象数です。

    一定の順位内での作品の割合を計算する:
    各作品のランクイン数を、その作品の投票対象数で割ります。これにより、一定の順位内での作品の割合が分かります。

    具体的な計算式を以下と画像に示します:
    作品ごとのランクイン数=最下位の順位−最上位の順位+1
    全作品のランクイン数=各作品∑​作品ごとのランクイン数
    作品ごとの投票対象数=範囲内の順位の数×作品数
    一定の順位内での作品の割合=作品ごとの投票対象数作品ごとのランクイン数​
    これらの計算を行うことで、一定の順位内での作品の順位を求めることができます。もしさらなる質問や詳細があればお知らせください!

  • 6二次元好きの匿名さん24/05/02(木) 17:00:56

    AIあにまん民がおるな……

  • 7二次元好きの匿名さん24/05/02(木) 17:02:58

    1. 各作品について、範囲内にランクインした数を投票対象の数で割ります。これにより、その作品が範囲内の順位にどれだけランクインしているか(つまり人気があるか)を示す「範囲内ランクイン率」が得られます。

    2. すべての作品について上記の計算を行い、範囲内ランクイン率が最も高い作品が、その部門で最も人気のある作品と言えます。

    この方法であれば、各作品がどれだけ範囲内の順位にランクインしているか、つまり人気があるかを比較的簡単に計算することができます。ただし、この方法では同一作品からランクインしているものの最上位と最下位は考慮されません。それらを考慮に入れる必要がある場合は、別の計算方法を考える必要があります。ご質問がありましたら、お気軽にどうぞ。よろしくお願いいたします。😊

  • 8二次元好きの匿名さん24/05/02(木) 17:08:08

    あ、そうか、先にAIに訊けばよかったのか

    便利な時代になったなあ


    >>4

    ☑作品の最上位の順位

    ☑作品の総数

    ☑ランクインしている作品の数

    ☑作品から何割が範囲内にランクインしているか

    これはOK、分かる

    ただ最下位については殆どの作品がランク外まで広がっているので難しい

    そうなると順位範囲も求められない

    ランク外を切り捨てる場合殆どの作品の最下位ラインが並ぶことになるし、存在しないものがランクインすることになるけど、それでもいいならそれでやる……


    あとAIの文章って思った以上に理解するのに時間かかるのね

  • 9二次元好きの匿名さん24/05/02(木) 17:08:51

    このレスは削除されています

  • 10二次元好きの匿名さん24/05/02(木) 17:09:26

    このレスは削除されています

  • 11二次元好きの匿名さん24/05/02(木) 17:21:17

    >>10

    とあるシリーズはわからないのでそれが正しいのかちょっと答えられない


    ジブリで例えてみよう

    ジブリキャラ人気投票があったとして、たとえば1位が「トトロ」、2位「猫バス」、3位「ムスカ」が結果だったとする(4位以下は切り捨て)

    この場合上位を占めてるトトロが上でラピュタが下だと考えられる

    ただ実際にはトトロからはこの他に「中トトロ」「小トトロ」「まっくろくろすけ」「カンタのばあちゃん」が投票対象、ラピュタからはムスカのみが対象で、そうなるとトトロは1/3しかランクインしていないがラピュタは全員ランクインしていることになる

    それだとキャラクター部門においてトトロとラピュタはどっちが上になるの?

    って話

  • 12二次元好きの匿名さん24/05/02(木) 17:24:00

    >>11

    追記するとランクインしなかった4者は4位以下にちゃんと存在してる

  • 13二次元好きの匿名さん24/05/02(木) 17:26:17

    >>8

    小学生でもわかるようにとか知識レベルを指定したり具体的な説明の流れを指定したりするといい

  • 14二次元好きの匿名さん24/05/02(木) 17:35:05

    じゃあ、エクセルで計算するとしたらどうなる?
    これなら多分理解できる
    算数は全く別言語だと思ってるけどエクセルとならある程度は語り合える

  • 15二次元好きの匿名さん24/05/02(木) 17:51:26

    >>8

    適切なプロンプト入れないとこうなる

    質問は明快に、狭く聞くのがヨシ

  • 16二次元好きの匿名さん24/05/02(木) 18:04:46

    >>11

    それは普通にトトロが上になるんじゃないか?

    ムスカのみ投票対象=ムスカ以外は投票対象に選出もされない程度の人気しかないキャラって解釈が自然な気がするし

    単純に部門ごとに得票数足し合わせて比べる(得票数が公開されてない場合他の人気投票を参考に票数を割り当てる)とかじゃ駄目なのか

  • 17二次元好きの匿名さん24/05/02(木) 18:09:43

    >>16

    例えが悪かった

    この場合全キャラが投票対象、つまり天空の城ラピュタには元からムスカしか登場しないものと考えてほしい

  • 18二次元好きの匿名さん24/05/02(木) 19:16:21

    >>17

    登場人物全員ムスカか…なんかもうありそうだな

  • 19二次元好きの匿名さん24/05/02(木) 19:19:42

    >>18

    いやそれだとムスカAムスカBみたいな感じで対象が増えるだろうからマジでムスカ「一人」しか登場しないラピュタになるものと思われる

  • 20二次元好きの匿名さん24/05/02(木) 19:32:38

    割合もいいかなーと思ったんだけど、さっきの例みたいに作品によっては投票対象が1つしかないものもあるからあんまりアテにならないのかなーって
    例えば20ある内19個がランクインしてしかも上位を占めてるのに、ランク外ギリギリの辺りに1つランクインしただけの作品があって、たまたま後者がその1つで100%になるからって前者より上になるのは変じゃない?

  • 21二次元好きの匿名さん24/05/02(木) 20:35:27

    Latexのディスプレイ数式モードを$$でやるタイプなんだ…ってのが気になって話が頭に入ってこない

  • 22二次元好きの匿名さん24/05/02(木) 21:26:21

    >>11

    それだと一人しか対象になってない時点でラピュタのほうが下なのは明確では?


    同じ100人中の10名と5名だったら10名ノミネートされてる方がポイント高いとは言えるけど


    ただまあその視点で検討するなら、一位100点、100位1点とかでポイント獲得制にして作品ごとの合計獲得ポイントで順位付けするとかじゃない?

    どの程度の重みづけするかは裁量次第だけど


    人気ないモブが複数いようが作品人気には大した影響しないので、ノミネート率はあまり考慮しないもんだと思うし

  • 23二次元好きの匿名さん24/05/02(木) 21:32:13
  • 24二次元好きの匿名さん24/05/02(木) 21:38:23

    このレスは削除されています

  • 25二次元好きの匿名さん24/05/02(木) 22:01:35
  • 26二次元好きの匿名さん24/05/03(金) 09:18:43

    >>25

    その例えもあまり良くないと思うよ


    ラピュタの唯一のキャラムスカで5位くらいだったとして、1位にトトロ、残りのトトロキャラは10位くらいだったとしても、唯一のキャラが他の作品に負けてる時点で人気としては下になるだろうし


    人気ないキャラの数は作品人気のマイナスには繋がらない

    人気あるキャラは作品人気のプラスには繋がる

    あまりにも酷いキャラで作品にマイナスであるとかは滅多にない事だからね

  • 27二次元好きの匿名さん24/05/03(金) 13:05:04

    一旦考えるのはやめて順位幅と割合を掛けることにした
    一定順位で切り捨てるつもりだったけど頑張って各作品2つが収まる範囲まで広げることにした
    これなら最低1つよりは正確さがグンと上がる筈
    根拠はないけど

  • 28二次元好きの匿名さん24/05/03(金) 16:41:24

    そもそも1の時点で「求めたい答え」ってのが明確になってないからなあ

    多分どちらの方が人気なのか、なんだろうけど

  • 29二次元好きの匿名さん24/05/03(金) 18:14:07

    それな


    >>11

    「キャラクター部門」において「作品」の順位を求めたい理由がまずよくわからないんだが

    「作品部門」における「作品」の順位ではダメなの?

  • 30二次元好きの匿名さん24/05/03(金) 19:29:08

    >>28>>29

    それだと他の要素がノイズになる

    作品部門ではストーリーや音楽も含めての評価になるのでキャラクターに絞った人気がわからない

    知りたいのは「特定の要素に絞って見たときの作品の人気順」

    これは他の調査の指標に使う


    >>27でやってみたけど、最上位か最下位だけ極端に振り切れているとそっちに引っ張られてしまった

    例えば1位から200位までに100%収まっている作品Aと、10位から150位までに90%が収まっているが残りの10%分が300位付近とランク外に存在する作品Bがあったとして、作品Bの下10%を除けばほぼ同じようなものなのに、結果は驚くほど離れた数値が出てしまう


    ので、順位幅に1を最上位と中央値×2と最下位の平均で割った数を掛けたものに割合を掛けて求めることにしたら、この問題は解消された

    (中央値がランク外にある場合は切り捨てラインの順位を代わりとする)

  • 31二次元好きの匿名さん24/05/03(金) 19:50:01

    何をやっているのかも何がやりたいのかも全くわからん

  • 32二次元好きの匿名さん24/05/03(金) 20:16:56

    >>30

    >知りたいのは「特定の要素に絞って見たときの作品の人気順」

    説明ありがとう、多分なにがしたいのかわかった

    たとえばキャラクター部門で

    1位 作品Aのキャラ

    2位 作品Bのキャラ

    3位 作品Bのキャラ

    4位 作品Cのキャラ

    5位 作品Aのキャラ

    6位 作品Bのキャラ

    (※全作品、全キャラがランクインしており、6位までがデータのすべて)

    って結果だったとき、キャラ人気が高いのは作品AなのかBなのか?みたいな話ってことでOK?


    そうなると、今度は>>4案の「キャラクター部門のランキングに重み付け」では駄目な理由がわからん

    >>8

    >ランク外を切り捨てる場合殆どの作品の最下位ラインが並ぶことになるし、存在しないものがランクインすることになるけど、

    ここがわかりにくいからもうちょっと詳しく

  • 33二次元好きの匿名さん24/05/03(金) 20:27:59

    よくわからんけど下位データ切り捨てる時点で結果に多少の偏りが生じるのは避けられないから
    そのへん諦めるか手間かけて全データ計算の対象にするかのどっちかは必須じゃない?

  • 34二次元好きの匿名さん24/05/03(金) 20:36:46

    >>32

    そうなるね

    今回は対象が1つしかない作品もあるから、この場合はCもどういう扱いになるか気になる


    重み付けについては、駄目というより全く知らない言葉(Google先生に聞いてもよく理解できなかった)なので(AIに相談して教えてもらったとはいえ)何をどうするかわからずおっかなくて手を付けてないだけ

    なにを重みとしてどういう数値で扱うのかが分からなかった


    >>8のについては今見ても自分でもよくわからない

    何言ってんだろ自分

    多分、「例えば6位までがランク内として考え、作品Aのキャラが1位5位9位にある場合、仮にランク外まで広がっている作品の最下位を最低ラインである6位として考えることにすると、本来そこに作品Aのキャラはいないのにいることにして考えるけどそれでいいのか?」って意味だと思う

    なんでその考えが出たのかはわからん


    >>33

    全部で700位ぐらいあるので諦める方向でやってる

    でもどうすればなるべく正確になるように諦められるかを今は考えてる

  • 35二次元好きの匿名さん24/05/03(金) 21:25:47

    ざっくりとした点数付けでいいんでない?>重み付け


    例えば

    【得点】=【1000点】÷【順位】

    ってすると1位と2位で500点差あるけど250位と500位では2点差で高順位ほど影響大、といった感じ

    順位を2乗したり逆に√順位で割ったり、しっくり来るよう調整する必要はあると思うけど

  • 36二次元好きの匿名さん24/05/03(金) 21:30:20

    普通に作品ごとの得票数の合計で比べればいいんでないの

オススメ

このスレッドは過去ログ倉庫に格納されています