piątek, 24 grudnia 2010

d∞

o czym warto pamiętać fałszując dane

Brokuł romanesco przypuszczalnie nie ilustruje prawa Benforda.
Jest jednak pięknym przykładem fraktala, których nigdy dość.
ResearchBlogging.orgPotoczne rozumienie statystyki obfituje w przeinaczenia a ludzie mają tendencję do dostrzegania znaczących wzorców tam, gdzie ich tak naprawdę nie ma. Profesjonalne jej rozumienie również dostarcza wielu kłopotów. Jednocześnie, wszechświat, jako ostateczny rzucający kośćmi, lubi płatać nam figle.

Przykładowo, jak pokazuje przykład rozwinięcia dziesiętnego liczby pi, dostatecznie długi ciąg przypadkowych znaków pozwala na dostrzeżenie w nim niemal dowolnych znaczących wzorców - odpowiednia ilość małp dostatecznie długo stukających w maszyny do pisania pozwoli na napisanie Biblii a astronomiczna liczba planet w połączeniu z astronomiczną skalą czasu dają ogromnie nieprawdopodobnemu zjawisku życia szansę zaistnienia. Wyglądający nieprzypadkowo zestaw wyników podrzucania monetą ORORORORO jest prawdopodobny dokładnie w takim samym stopniu jak nieregularny a więc "przypadkowy" jak OORROROOR. Nasze rozumienie "przypadkowości" jest więc dość płynnym pojęciem - widzenie wzorców jest związane ze specyficznymi dla człowieka mechanizmami percepcji.

Jedną z ciekawszych prawidłowości dotyczących prawdopodobieństwa jest prawo Benforda. Określa się tym mianem fakt zaskakująco uporządkowanego występowania cyfr w wartościach statystycznych zebranych w tak odległych od siebie dziedzinach, jak astronomia, sport czy wyniki wyborów. Na czym dokładnie polega ten fenomen? Wydawać by się mogło, że takie dane jak powierzchnia zbiorników wodnych, częstotliwości obrotów pulsarów czy liczby wylosowane z gazety wykazywać się będą nieuporządkowaniem. Otóż okazuje się, że można określić prawdopodobieństwo z jakim pierwsza cyfra każdej z tych wartości będzie konkretną cyfrą - jest np. 30,1% szans, iż będzie jedynką a tylko 4,9% szans, że będzie dziewiątką. Najprawdopodobniej więc będzie to raczej 1xx niż 4xx. Co ciekawe, reguła ta działa niezależnie od skali, co oznacza, że możemy przekonwertować jednostki na inne a prawidłowość pozostanie.

Tabela rozkładu wartości prawdopodobieństw dla poszczególnych cyfr


Rozkład Benforda został opisany po raz pierwszy w 1881 roku, przez amerykańskiego astronoma Simona Newcomba w 1881 roku, ponownie odkrył go Frank Benford w 1938. Lista znanych od tego czasu wielkości w których sprawdza się prawo Benforda jest imponująca a niedawne badanie tylko ją poszerzyło. Powierzchnie zbiorników wodnych, emisje gazów cieplarnianych poszczególnych krajów, liczby składające się na ciąg Fibonacciego, statystyki futbolowe, najwyższe budynki świata, stałe fizyczne, statystyki dotyczące 250 000 ostatnich trzęsień ziemi, jasności rozbłysków gamma i dane epidemiologicznego 987 chorób zakaźnych w roku 2007.

Co z tego wynika? Znajomość prawidłowości, które powinny pojawiać się w statystykach "wziętych z natury" pozwala na wysnuwanie przypuszczeń odnośnie potencjalnych czynników zakłócających w wypadku wystąpienia danych niezgodnych z oczekiwanymi w świetle rozkładu Benforda. Mogą to być wcześniej przeoczone mniejsze trzęsienia ziemi (jak w wypadku autorów publikacji), jak również księgowi kreatywni i manipulacje wynikami głosowania (jak przypuszczalnie miało miejsce w wypadku wyborów w Iranie).


grafika:
brokuł - cc iconRichard Bartz
rozkład Benforda - Gknor, grafika w domenie publicznej


źródło:
Sambridge, M., Tkalčić, H., & Jackson, A. (2010). Benford's law in the natural sciences Geophysical Research Letters, 37 (22) DOI: 10.1029/2010GL044830


3 komentarze:

  1. Już kiedyś słyszałem/czytałem gdzieś o tym prawie. Możliwe, że było to właśnie przy wyborach w Iranie. Zabawna sprawa.
    Tak przy okazji, czytając wstęp do tej notki (jak i czytając parę innych notek), zakradło się do mojej głowy pytanie : znana jest Ci może twórczość Terry'ego Pratchett'a, a ściślej mówiąc "Nauka Świata Dysku" (tom 1-3)? :P

    OdpowiedzUsuń
  2. Czytałem kilka początkowych tomów, wiedziony (nie do końca przezwyciężonym, odrobinę kompulsywnym) przeświadczeniem, iż czytał będę po kolei. Do Nauki Świata Dysku nie dotarłem, ale jestem pewien, że mogłoby mi się spodobać. Tak wiele książek a tak mało czasu - nadrobię!

    OdpowiedzUsuń
  3. To polecam zarówno jego zwykłą twórczość jak i szczególnie właśnie Naukę. Być może w obecnej chwili powie jedynie to, do czego sam już zdążyłeś dotrzeć, ale mimo wszystko warto. Polecam się jako ewentualne źródło tudzież wypożyczalnię ;)

    OdpowiedzUsuń

A co Ty o tym sądzisz?
Autor docenia komentarze podpisane. Jeśli nie posiadasz konta Google, najwygodniej będzie Ci użyć opcji Nazwa/adres URL, przy czym tego drugiego nie musisz wpisywać.