matematykaszkolna.pl
Badanie trafności przewidywanego wyniku NowyRobert: Witam serdecznie emotka Głowię się nad następującym problemem: Załóżmy, że mamy pewną liczbę zawodników, którzy zajmują kolejne miejsca bez możliwości remisu (ex−aequo). Moim zadaniem jest przewidzieć tę ostateczną klasyfikację i ocenić procentowo skuteczność swojej prognozy (patrząc tylko na różnice w końcowym rankingu a tym co sam na początku obstawiałem). Chyba najlepszym (ale dalej nie mam pewności czy na pewno optymalnym) pomysłem na jaki udało mi się wpaść jest porównanie wszystkich par zawodników (na zasadzie "każdy z każdym") pod względem tego, który z rozważanej dwójki zajął wyższe (albo niższe) miejsce i sprawdzeniu tej zgodności ze swoim prognozowaniem. W przypadku zgodności otrzymuję jeden punkt, a w przeciwnym wypadku zero punktów. Wynikiem byłby oczywiście stosunek liczby zdobytych punktów do ich liczby możliwych do zdobycia (czyli dokładnie tyle, na ile sposobów można wybrać dwóch zawodników), co już dalej można łatwo wyrazić procentowo. W pierwszym swoim podejściu wyznaczyłem wzór ogólny (ze względu na parzystość liczby zawodników musiałem rozpatrzeć dwa przypadki) na jakby największą możliwą liczbę "punktów odchylenia" od całkowitej zgodności prognozy z rzeczywistym rankingiem sumując wartości bezwzględne różnic liczb (ze wszystkich par) oznaczających zajęte przez danego zawodnika miejsce (w klasyfikacji ostatecznej i tej, którą ja sam przewidywałem). Jest to − w moim odczuciu (mogę się mylić) − trochę gorszy sposób niż ten poprzedni, lecz nakierował mnie on na to, żeby bardziej zagłębić się w poszukiwanie jakichś dobrych statystycznych narzędzi do tego celu. Po długich poszukiwaniach natknąłem się na coś takiego jak WSPÓŁCZYNNIK KORELACJI SPEARMANA: http://www.statystyka-zadania.pl/wspolczynnik-korelacji-spearmana/ Zauważyłem w nim pewne podobieństwo z opisanym wyżej sposobem, a mianowicie obliczanie tych różnic, o których wspomniałem. Wydaje mi się, że można go do tego problemu wykorzystać, ale nie mam całkowitej pewności. Wyniki, dla pewnych konkretnych wartości jakie sobie przyjąłem, wydają się być sensowne i stosunkowo zbliżone do tych z dwóch poprzednich moich podejść, a procentową trafność swojej prognozy też można by łatwo wtedy ustalić uwzględniając obliczoną wartość takiego współczynnika oraz długość przedziału od −1 (najgorsza trafność) do 1 (najlepsza trafność). To wszystko do czego udało mi się dojść. Moje pomysły się już skończyły i mam wrażenie, że już na nic lepszego nie wpadnę. Czy dałby ktoś radę rozwiać moje wątpliwości i rozstrzygnąć, który z opisanych przeze mnie sposobów najlepiej oddaje i bada trafność omawianej prognozy oraz ewentualnie wskazać różnice w ich dokładności i skuteczności? A może jest jeszcze jakiś inny lepszy sposób? Zależy mi po prostu na poznaniu tego najlepszego. Z góry dziękuję już teraz, chociażby nawet za samo przeczytanie tych moich długich wywodów. Pozdrawiam i liczę na Waszą pomoc, Robert C.
22 lut 02:07
Blee: A co oznacza 'najlepiej' Twoim zdaniem. Podam dwa przyklady rozstawien koncowych zawodnikow i podaj mi, ktory z zestawow WEDLUG Ciebie powinien wyjsc jako bardziej zblizony przewidywaniom Twoim: Mamy 10 zawodnikow startujacych w zawodach. Przewidujesz ze ich kolejnosc bedzie taka jak kolejnosc bedzie: a,b,c,d,e,f,g,h,i,j 1) ostateczna kolejnosc to: j,b,c,d,e,f,g,h,i,a (jedynie zawodnicy a oraz j nie zajeli przewidzianych miejsc) 2) ostateczna kolejnosc to b,a,d,c,f,e,h,g,j,i (zaden zawodnik nie jest tam gdzie przewidziano, ale jest nie dalej niz jedno miejsce od przewidywanego) Metodą porównywania par otrzymasz tutaj:
 33 
W pierwszym przypadku strate 17 punktow (czyli masz:

).
 50 
 45 
W drugim przypadku strate 5 punktow (czyli masz:

).
 50 
Innymi slowy − co jest istotniejsze, trafienie dobrego miejsca dla jak najwiekszej liczby zawodnikow czy wstrzelenie sie w poblize dobrych miejsc jak najwiekszej liczby zawodnikow?
22 lut 07:36
Blee:
 28 40 
Porawka ... wychodzo odpwiednio

i

.
 45 45 
22 lut 07:57
NowyRobert: Dziękuję za odpowiedź i dobrze obrazujący sytuację przykład emotka Odpowiadając na pytanie − zdecydowanie to drugie, tzn. "wstrzelenie się w pobliże dobrych miejsc jak największej liczby zawodników".
22 lut 08:02
NowyRobert: Czy jest ktoś w stanie jeszcze pomóc?
23 lut 00:18
Blee: Skoro chcesz mocno zaznaczyc wszelkiego rodzaju anomalie pomiedzy przewidywana kopejnoscia a faktyczna, to wspolczynnik korelacji Spearmana mozesz sobie odpuscic. Ow wspolczynnik moal na celu wlasnie zniwelowanie oddzialowywania anomalii, a ty nie tylko nie chcesz ich niwelowac, chcesz wrecz je wzmocnic. Wybranie optymalnej metody jest nierealne w momencie w ktorym nie wiemy co ma ow metoda pokazac, w sensie ... kiedy wstrzelenie sie X miejsc wraz z malymi roznicami pozostałych będzie lepsze od wymieszania sie (w mniejszym stopniu) WSZYSTKICH pozycji. Ja bym mogl zaproponowac rzecz banalna czyli porownywanie miejsc danego gracz i liczenie roznicy tejze wartosci. Aby nacisk nałożyć na wstrzelanie sie w okolice (aby sytuacja 2 wygladala o wiele lepiej niz sytuacja 1) ow roznice mozna by potraktowac nie modulem, a na przyklad 2 albo zaszalec i walnac 3. Czy bedzie sie lepiej sprawowac, nie wiem ... bo nie wiem w jakim stopniu jest wazniejsze jedno od drugiego (co pisalem powyzej).
23 lut 08:42
NowyRobert: Rozumiem. Dziękuję bardzo emotka W pełni mnie satysfakcjonuje taka odpowiedź emotka
23 lut 10:09