Parol Kawalerski Parol Kawalerski
445
BLOG

Myślące pudełko na zapałki

Parol Kawalerski Parol Kawalerski Nauka Obserwuj temat Obserwuj notkę 1

 „Logika- osoba podejrzana, stale prześladowana przez wyższych dygnitarzy, posłów, poważne instytucje i dziennikarzy”

 

Precyzyjne myślenie i wnioskowanie było zawsze atrybutem matematyki. Dopiero w XIX wieku matematyce przyjrzał się krytycznie Georg Cantor. Zbadał ją całkowicie od podstaw. To dzięki jego dociekliwości mogliśmy spojrzeć na matematykę z zewnątrz wprowadzać zmiany opierające się na roli abstrakcji.  Dziś jednak widzimy, że nie wolno nam odbiegać od wymogów ścisłości.  Jednak wiele ludzi nadal daje się zwieść myśleniu, iż gdyby nie zwracać uwagi na ścisłość to metamatematyka, jako nauka stałaby się prostsza. To tak jakby zniesienie egzaminu na pilota samolotu ułatwiłoby latanie samolotem.

Zastanówmy się czy roboty które potrafią się uczyć mogą istnieć tylko na kartkach papieru powieści sf.  Obiegową prawda jest to że komputer to takie wielkie liczydło, z którego nie da się więcej wycisnąć niż się w niego wcześniej włożyło.

W szybkości obliczeń i w pojemności przechowywanych danych to jednak komputer ma nad nami przewagę. Zaś człowiek stale broni się jednym…intuicją. Czyli tak naprawdę, czym? Tym, że człowiek w pełni potrafi podejmować decyzje przy informacji niepełnej, kierując się swoimi odczuciami bądź przekonaniem. Sztuczna inteligencja komputerów to nic innego jak właśnie zdolność nauki na własnych bledach.  Korzystanie z wiedzy niekoniecznie mającej cos wspólnego z problemem no i intuicja. Dla maszyny to czysta abstrakcja, jednak dla nas ludzi to czysta codzienność.

No ale zbudujmy sobie robota do gry w pionki. Który będzie się uczył na własnych błędach. Który po pewnym czasie sam opanuje prostą gre.

 Na dziewięciopolowej szachownicy (rys. 1) stoją trzy białe pionki i trzy czarne. Poruszają się one tak ja pionki w szachach. Jednak dla ścisłości nie ma możliwości ruchu o dwa pola za pierwszym ruchem. Pionek może się poruszać do przodu, bądź po skosie bić pionek innego koloru, w lewo lub w prawo. I taak jak w szacach pionek mający bezpośrednio naprzeciwko siebie pionek przeciwnego koloru nie może wykonać ruchu do przodu, ani bic do przodu. Zatem w grze wygrywa gracz, który:

- albo zbije wszystkie pionki przeciwnika

-albo zablokuje przeciwnika tak że ten nie będzie mógł wykonać już żadnego ruchu

-albo pierwszy doprowadzi jeden pionek do końcowej linii.

Od razu widać prostotę gry i tak jak w kółko i krzyżyk wystarczy wymyślić odpowiedni algorytm jak grac najlepiej i przekazać komputerowi. Jednak wcale nie o to na chodzi. Chodzi o to by mu tej wiedzy nie przekazywać. I żeby sam do tego doszedł i sam wymyślił sposób. Ten sposób przypomina uczenie psa tabliczki mnożenia. Trik polega na wyuczeniu w nim pewnych zachować. Gdy pytam Ciapka ile jest 5 razy 5 to ten zaczyna szczekać.  Przy dwudziestym piątym szczeknięciu daje mu niewidoczny dla obserwatorów znak, by ten przestał. Pies już nie szczeka, a jego zachowanie świadczy nam o tym, że wie o co chodzi.

No ale wróćmy do gry. My gramy białymi i wykonujmy pierwszy ruch. Zaś komputer rusza się drugi. Gra jest prosta, więc nie trudno zauważyć, bądź przetestować wszystkie konfiguracje. No dobrze, wykonajmy ruch środkowym albo lewym pionkiem. Dlaczego nie prawym? Bo prawy da nam odbicie lustrzane ruchu lewym. Jak łatwo zauważyć jest 24 możliwych pozycji dla posunięcia czarnych. I dla ułatwienia możemy je wszystkie sobie przedstawić.

Nasz komputer dla wygody nazwijmy 3PO (tak tak fascynacja SW). Niech się składa z 24 pudełek po zapałkach. Na każdym rysujemy bądź naklejamy rysunek z jedną z 24 pozycji.  Kolorowymi strzałkami na rysunkach zaznaczamy wszystkie możliwe ruchy w danej sytuacji. W pudełku zamieszczamy tyle kolorowych cukierków ile jest strzałek na rysunku. Każdy kolor strzałki odpowiada jednemu cukierkowi z pudełka. Nauka odbywa się w charakterze kar, za błędne ruchy. Wykonujemy pierwszy ruch pionkiem lewym albo środkowym.  Po czym bierzemy pudełeczko z naklejoną pozycją odpowiadającą tej z szachownicy. Potrząsamy pudełkiem i wyciągamy jeden z cukierków. W ten sposób wykonujemy ruch za naszego 3PO taki jaki odpowiada kolorowi cukierka. Następnie my się ruszamy i powtarzamy całą czynność cukierkiem itd. Gra kończy się dość szybko.

Lecz jeśli 3PO wygrał, gramy od nowa. Jeśli przegrał zostaje ukarany. Usuwamy na stałe cukierek, którego kolor odpowiadał strzałce opisującej ostatni ruch. I gramy od początku. Jeśli któreś pudełko zostanie puste to znaczy że nasz 3PO nie może dalej wykonać żadnego ruchu. Więc przegrał. W tym wypadku karzemy go zabierając cukierek z przedostatniego ruchu.

Spróbujmy zagrać z nim na tej zasadzie tak z kilkadziesiąt razy a zobaczymy, że nasz 3PO stanie się graczem nie do pokonana.

No ale pójdźmy dalej i stwórzmy kolejny komputer- R2. Gdy R2 przegra nic mu nie robimy, a gdy wygra głaszczemy go i nagradzamy dodając mu po jednym cukierku do wszystkich pudełek na których są ruch zwycięskich partii. Możemy też stworzyć Jacka z dwoma cukierkami za wygraną i usunięciem ostatniego za przegraną.  Dzięki temu możemy stworzyć zawody komputerów 3PO vs R2 czy R2 vs Jacek itd. Itd. Dzięki takim Zawodą i mnogości naszych komputerów stworzymy różne sposoby nauczania. Jedne będą topornie prowadzić do celu zaś inne szybko sobie poradzą z zadaniem. W każdym razie w zawodach chodzi o to, które urządzenie szybciej się nauczy. No i najważniejsze jednak z tego jest to, że nasz pozbawione rozumu maszyny będą sprawiać wrażenie jakby naprawdę się uczyły prawidłowych posunięć. Jakby myślały…jakby miały intuicję…

Ot wsadziłem kij w mrowisko. 

Zobacz galerię zdjęć:

Rys.1
Rys.1

Mikołaj Parol, student Wydziału Prawa i Administracji w Łodzi, pasjonat historii, fan Gwiezdnych Wojen i fantastyki, miłośnik lotnictwa, wojskowości i gier rpg. Czytacz jak i oglądacz, o własnym zdaniu. Nacjonalista myślący,eurosceptyk i patriota. Znajdziesz mnie jeszcze tutaj: https://twitter.com/MikolajParol http://peron3-tor2.blogspot.com/ http://3obieg.pl/author/parol-kawalerski

Nowości od blogera

Komentarze

Inne tematy w dziale Technologie