Sztuczna inteligencja przewidziała wyniki wyborów....

Ostatnio poważne osoby przysłały mi linka do artykułu o tym, że sztuczna inteligencja przewidziała wyniki wyborów lepiej niż sondaże na podstawie aktywności internautów.

Każdemu z osobna musiałem tłumaczyć, że to jest klasyczny fake news z dziedziny nauki, a historia dziedziny sztucznej inteligencji jest wręcz zbudowana z takich fake newsów. Uznałem, że dla dobra zdrowego rozsądku, warto może moje argumenty nieco upublicznić.

Po pierwsze, każdy naukowiec potwierdzi, że informacje w mediach na temat różnych osiągnięć z jego dziedziny nauki są zazwyczaj zupełnie nieadekwatne do istoty osiągnięcia. Żurnaliści nie rozumieją o co chodzi i podkręcają te informacje tak, żeby spełniały kryterium "dostatecznej sensacyjności"

Po drugie, historia dziedziny sztucznej inteligencji, to historia obietnic zupełnie bez pokrycia, bez dostatecznego zrozumienia problemu, i bardzo przesadzonych prezentacji osiągnięć. Dziś dziedzina, która ciągle używa nazwy sztuczna inteligencja, powinna się nazywać "inteligentne techniki głębokich sieci neuronowych i masowych analiz danych" i powinno być jasne, że o ile przy pomocy tych technik można uzyskać i uzyskuje się naprawdę imponujące osiągnięcia, to dziedzina AI dzisiaj, tak odległa jest od wizji realizacji robotów z filmu "Terminator" jak tzw. "inteligentny proszek do prania" od wizji najprostszego robota domowego, który sam zbierze w mieszkaniu rzeczy wymagające prania, wypierze je, wysuszy i ułoży w szafach.

Wracając do sondaży, oczywiście można próbować zastąpić je symulacjami na bazie danych dostępnych w sieci, ale trzeba mieć świadomość kilku zasadniczych trudności. Pierwsza to fakt, że chociaż mamy do dyspozycji nieporównywalnie więcej opinii niż w zwykłym sondażu, to trudno wyobrazić sobie utworzenie z nich reprezentatywnej próbki. Chyba że program bierze również pod uwagę wyniki sondaży publikowanych w sieci, ale wówczas mógłby się ograniczyć do prostej matematycznej analizy tych sondaży, a "jazgotu" w internecie użyć co najwyżej do nieznacznej modyfikacji wyników. Tak czy inaczej jesteśmy na etapie wyznaczenia aktualnych preferencji wyborczych, co stosunkowo łatwo da się zrobić wyłącznie na podstawie sondaży — a trudno sobie wyobrazić, żeby tendencyjne i niereprezentatywne opinie z internetu pomogły poprawić reprezentatywność.

Drugi etap, dokładnego przewidzenia wyników wyborów, to uwzględnienie faktu, że wynik wyborów odzwierciedla aktualne preferencje, ale zaburzone (zwykle znacząco) przez różną mobilizację różnych elektoratów, a także przez inne czynniki (jak na przykład przez fakt, że część wyborców — nie wiadomo jak duża — decyzję o zmianie wyboru potrafi podjąć w lokalu wyborczym w oparciu o nierozpoznawalne czynniki). To są czynniki niemierzalne, których zasadniczo nie da się uwzględnić, bo tu nie ma żadnych twardych danych, które można by wrzucić do komputera.

Można więc podać przybliżony stan preferencji wyborczych w dniu wyborów (czy to w oparciu o analizę matematyczną sondaży, czy też jakiś trafny program przekształcający informację w sieci w takie dane — ale zbudowanie na tej podstawie prognozy, przewidzenie wyników wyborów, to konieczność wprowadzenia czynników niemierzalnych. To zazwyczaj lepiej zrobi człowiek z odpowiednią niemierzalna wiedzą, niż program komputerowy.

Jeśli po wyborach się twierdzi, że jakaś sondażownia najtrafniej przewidziała wynik wyborów, to jest nieporozumienie, bo sondażownia bada preferencje wyborcze, a jeśli trafiła w wynik wyborów, to znaczy, że zrobiła błąd równy zaburzeniom spowodowanym czynnikami niemierzalnymi. To samo dotyczy też rewelacji ze wspomnianego na wstępie artykułu. Generalnie podejrzewam, że jest to "pic na wodę", chociaż nie wykluczam, że po poznaniu szczegółów programu uznałbym to za bardziej poważne przedsięwzięcie.

Związek z tym ma moje osobiste doświadczenie, gdy w dawnych czasach dorabiałem jako programista. Dostałem zlecenie na obliczenie jakiejś liczby liczby zamawianych produktów, która to ilość wynikała ze złożonych danych zawartych w tabelach. Poproszono mnie żebym zbudował sieć neuronową, która na podstawie tej dużej ilości danych "nauczy się" wyliczać te liczbę. Po wielu próbach stwierdziłem, że sieć uczy się zbyt wolno, i jest to raczej jeden z tych problemów, który tylko teoretycznie nadaje się do rozwiązania za pomocą sieci neuronowej. Prawdopodobnie dzisiejsze techniki głębokich sieci neuronowych (polegające na pewnym wstępnym wglądzie w problem przez człowieka i ukierunkowaniu uczenia) byłyby odpowiedniejsze. Ale zapewne doprowadziłyby do tego samego rozwiązania. Przyjrzałem się dokładniej tabelom danych i napisałem stosunkowo prosty wzór, nieelegancki, "pi razy oko", który dawał wyniki zgodne z tabelami. Wzór ten zaszyłem w program i oddałem zlecenie. Zleceniodawcy byli bardzo zadowoleni, ponieważ okazało się że program pracuje znakomicie i znacznie zwiększył efektywność produkcji.

Sztuczna inteligencja przewidziała wyniki wyborów....

CBOS alarmuje o nastrojach. Sytuacja wymyka się spod kontroli poza jednym

KO słabnie, rośnie prawica. Najnowszy sondaż w toku afery szpitalnej

Rekord Nawrockiego, krach Trzaskowskiego. Ranking zaufania do polityków

Kraków może dać przykład. Niezadowolenie w miastach narasta

Komentarze

Inne tematy w dziale Polityka

#Ukraina

Nie tylko Nawrocki. W innym europejskim kraju też mają dość Zełenskiego

Unia wyklucza z ochrony ukraińskich poborowych. Na wniosek Kijowa

Mer Lwowa kontra Sikorski. Polska totalnie pominięta w podpisanych umowach

#Prezydent

Nawrocki został otruty w kampanii? Prokuratura sprawdzi sensacyjne informacje

Donośny okrzyk Nawrockiego dotarł do Turcji. Erdogan był zaskoczony

Miało być spotkanie Nawrockiego z Zełenskim. Jeden z nich się wycofał