jan mak jan mak
2181
BLOG

Sztuczna inteligencja przewidziała wyniki wyborów....

jan mak jan mak Sondaż Obserwuj temat Obserwuj notkę 98

Ostatnio poważne osoby przysłały mi linka do artykułu o tym, że sztuczna inteligencja przewidziała wyniki wyborów lepiej niż sondaże na podstawie aktywności internautów.  

Każdemu z osobna musiałem tłumaczyć, że to jest klasyczny fake news z dziedziny nauki, a historia dziedziny sztucznej inteligencji jest wręcz zbudowana z takich fake newsów. Uznałem, że dla dobra zdrowego rozsądku, warto może moje argumenty nieco upublicznić.

Po pierwsze, każdy naukowiec potwierdzi, że informacje w mediach na temat różnych osiągnięć z jego dziedziny nauki są zazwyczaj zupełnie nieadekwatne do istoty osiągnięcia. Żurnaliści nie rozumieją o co chodzi i podkręcają te informacje tak, żeby spełniały kryterium "dostatecznej sensacyjności"

Po drugie, historia dziedziny sztucznej inteligencji, to historia obietnic zupełnie bez pokrycia, bez dostatecznego zrozumienia problemu, i bardzo przesadzonych prezentacji osiągnięć. Dziś dziedzina, która ciągle używa nazwy sztuczna inteligencja, powinna się nazywać "inteligentne techniki głębokich sieci neuronowych i masowych analiz danych" i powinno być jasne, że o ile przy pomocy tych technik można uzyskać i uzyskuje się naprawdę imponujące osiągnięcia, to dziedzina AI dzisiaj, tak odległa jest od wizji realizacji robotów z filmu "Terminator" jak tzw. "inteligentny proszek do prania" od wizji najprostszego robota domowego, który sam zbierze w mieszkaniu rzeczy wymagające prania, wypierze je, wysuszy i ułoży w szafach.


Wracając do sondaży, oczywiście można próbować zastąpić je symulacjami na bazie danych dostępnych w sieci, ale trzeba mieć świadomość kilku zasadniczych trudności. Pierwsza to fakt, że chociaż mamy do dyspozycji nieporównywalnie więcej opinii niż w zwykłym sondażu, to trudno wyobrazić sobie utworzenie z nich reprezentatywnej próbki. Chyba że program bierze również pod uwagę wyniki sondaży publikowanych w sieci, ale wówczas mógłby się ograniczyć do prostej matematycznej analizy tych sondaży, a "jazgotu" w internecie użyć co najwyżej do nieznacznej modyfikacji wyników. Tak czy inaczej jesteśmy na etapie wyznaczenia aktualnych preferencji wyborczych, co stosunkowo łatwo da się zrobić wyłącznie na podstawie sondaży — a trudno sobie wyobrazić, żeby tendencyjne i niereprezentatywne opinie z internetu pomogły poprawić reprezentatywność. 

Drugi etap, dokładnego przewidzenia wyników wyborów, to uwzględnienie faktu, że wynik wyborów odzwierciedla aktualne preferencje, ale zaburzone (zwykle znacząco) przez różną mobilizację różnych elektoratów, a także przez inne czynniki (jak na przykład przez fakt, że część wyborców — nie wiadomo jak duża — decyzję o zmianie wyboru potrafi podjąć w lokalu wyborczym w oparciu o nierozpoznawalne czynniki). To są czynniki niemierzalne, których zasadniczo nie da się uwzględnić, bo tu nie ma żadnych twardych danych, które można by wrzucić do komputera. 

Można więc podać przybliżony stan preferencji wyborczych w dniu wyborów (czy to w oparciu o analizę matematyczną sondaży, czy też jakiś trafny program przekształcający informację w sieci w takie dane — ale zbudowanie na tej podstawie prognozy, przewidzenie wyników wyborów, to konieczność wprowadzenia czynników niemierzalnych. To zazwyczaj lepiej zrobi człowiek z odpowiednią niemierzalna wiedzą, niż program komputerowy. 

Jeśli po wyborach się twierdzi, że jakaś sondażownia najtrafniej przewidziała wynik wyborów, to jest nieporozumienie, bo sondażownia bada preferencje wyborcze, a jeśli trafiła w wynik wyborów, to znaczy, że zrobiła błąd równy zaburzeniom spowodowanym czynnikami niemierzalnymi. To samo dotyczy też rewelacji ze wspomnianego na wstępie artykułu. Generalnie podejrzewam, że jest to "pic na wodę", chociaż nie wykluczam, że po poznaniu szczegółów programu uznałbym to za bardziej poważne przedsięwzięcie.


Związek z tym ma moje osobiste doświadczenie, gdy w dawnych czasach dorabiałem jako programista. Dostałem zlecenie na obliczenie jakiejś liczby liczby zamawianych produktów, która to ilość wynikała ze złożonych danych zawartych w tabelach. Poproszono mnie żebym zbudował sieć neuronową, która na podstawie tej dużej ilości danych "nauczy się" wyliczać te liczbę. Po wielu próbach stwierdziłem, że sieć uczy się zbyt wolno, i jest to raczej jeden z tych problemów, który tylko teoretycznie nadaje się do rozwiązania za pomocą sieci neuronowej. Prawdopodobnie dzisiejsze techniki głębokich sieci neuronowych (polegające na pewnym wstępnym wglądzie w problem przez człowieka i ukierunkowaniu uczenia) byłyby odpowiedniejsze. Ale zapewne doprowadziłyby do tego samego rozwiązania. Przyjrzałem się dokładniej tabelom danych i napisałem stosunkowo prosty wzór, nieelegancki, "pi razy oko", który dawał wyniki zgodne z tabelami. Wzór ten zaszyłem w program i oddałem zlecenie. Zleceniodawcy byli bardzo zadowoleni, ponieważ okazało się że program pracuje znakomicie i znacznie zwiększył efektywność produkcji.

jan mak
O mnie jan mak

Zawodowo jestem matematykiem, informatykiem i logikiem. Od 1982 amatorsko zajmuję się publicystyką. Od 1992 działam też w sferze gospodarki.

Nowości od blogera

Komentarze

Inne tematy w dziale Polityka