Analiza danych sieciowych pozwala dokładniej przewidzieć wyniki wyborów. Fot. Pixabay
Analiza danych sieciowych pozwala dokładniej przewidzieć wyniki wyborów. Fot. Pixabay

Sondaże do lamusa? Big Data to przyszłość przedwyborczych trafnych analiz

Redakcja Redakcja Internet Obserwuj temat Obserwuj notkę 10

Analiza publicznie dostępnych w sieci danych - blogów, forów internetowych, artykułów - pozwala dokładniej niż badania sondażowe przewidzieć wyniki demokratycznych wyborów. Pokazują to w swoich badaniach naukowcy z Uniwersytetu Warszawskiego.

W samej Polsce jest teraz ponad 27 mln internautów.  Analizując internetowe treści, można z kilkudniowym wyprzedzeniem przewidzieć wyniki wyborów parlamentarnych czy prezydenckich. I to z dokładnością większą niż sondażownie. Pokazali to naukowcy z Wydziału Dziennikarstwa Informacji i Bibliologii Uniwersytetu Warszawskiego. Badacze próbują też - analizując Big Data, czyli duże, zmienne i różnorodne zbiory danych - przewidzieć trendy gospodarcze i kierunki rozwoju technologii.

Jakie sentymenty budzą słowa „Duda” i „Komorowski”?

Zespół naukowcóow wykorzystuje własne roboty - programy, które przeczesują zadane im źródła informacji w poszukiwaniu konkretnych słów. – Przed wyborami prezydenckimi w 2015 r. skierowaliśmy roboty do wszystkich źródeł polskich informacji, które pisały na temat wyborów. To były gazety, fora, blogi, publiczne posty na Facebooku - wyjaśnia kierownik badań, prof. Włodzimierz Gogołek. Roboty poszukiwały strony, na których padały słowa związane z wyborami: „Duda”, „Komorowski”, „wybory”.

image

Fot. Pixabay

W zebranych tekstach - po odpowiedniej obróbce - wyszukiwano tzw. sentymenty. Chodzi o emocje, jakie łączone były z poszukiwanymi słowami. Pozytywnymi sentymentami były, np. słowa „zadziwiać”, „lubić”, „pewny”, „wygrana”. A negatywnymi sentymentami, np. „winien”, „zniszczenie”, „upadek”. Sprawdzano, jakie sentymenty pojawiały się w otoczeniu słów „Duda” oraz „Komorowski”. I na tej podstawie wyliczano poparcie dla każdego z kandydatów. – Tydzień przed wyborami wiedzieliśmy, kto wygra. Nasze wyniki były dokładniejsze niż udostępnione przez CBOS – przekonuje prof. Gogołek. System przetestowano już podczas wyborów parlamentarnych w 2011 r. i w 2015 r., a także podczas wyborów prezydenckich w 2015 r.

Na tropie terroryzmu

Sondażownie wykonują badania na próbach tysiąc, dwa tysiące osób. W analizie Big Data zbiory są znacznie, znacznie większe. – To próba badawcza tak duża, że nie można jej osiągnąć w tradycyjnych badaniach. A wiadomo, że im większa próba badawcza, tym dokładniejsze wyniki badań. I to nawet jeśli w tej próbie znalazły się opinie małowartościowe – opowiada dr hab. Wiesław Cetera.

Prognozowanie wyników wyborów to tylko jeden z przykładów tego, jak można wykorzystać Big Data. Naukowcy z UW pomagają ekspertom z Narodowego Centrum Badań i Rozwoju wskazywać kierunki innowacyjnych działań, w które warto inwestować.

Analizowali również występowanie słów związanych z terroryzmem w portalu arabskiej stacji telewizyjnej Al-Dżazira. Z kolei studenci prof. Gogołka wykorzystywali analizę Big Data do próby przewidzenia notowań polskich spółek giełdowych.

– Ameryki nie odkrywamy. Takie systemy analizy dużych zasobów informacyjnych istnieją od wielu lat i są wykorzystywane głównie przez ekonomistów, a szczególnie bankowców. My pokazujemy kolejne przykłady zastosowania takich rozwiązań, m.in. w badaniach nauk humanistycznych, wcześniej zdominowanych badaniami jakościowymi – wyjaśnia prof. Gogołek.


Źródło: PAP

KW

© Artykuł jest chroniony prawem autorskim. Wykorzystanie tylko pod warunkiem podania linkującego źródła.

Komentarze

Inne tematy w dziale Technologie