Unijna tresura

Wyobraźmy sobie działanie programu cenzorskiego w możliwie najprostszej wersji, czyli wersji zawierającej tylko jedną zakazaną frazę. To może być cokolwiek, np. "cenzura" czy "nie lubię ruskich". Jeżeli program natrafi na komentarz o treści "nie lubię ruskich pierogów, lubię pierogi z kapustą", to usuwa cały taki komentarz. Jeśli usuwa "cenzurę", to usuwa cały komentarz, niezależnie od treści. Usunie więc post "cenzura jest pożyteczna" i post "cenzura nie pomaga". Ale czas zakończyć ten wstęp i skupić się na algorytmie takiego programu - jaki jest i jaki być powinien. Przykład "nie lubię ruskich" jest słabszy do takich analiz, więc skupimy się na prostszej frazie "cenzura".

Program musi mieć dostęp do słownika. W tym przypadku słownik wygląda tak: {cenzor, cenzora, cenzorach, cenzorami, cenzorowi, cenzorowy, ..., cenzur, cenzura, cenzuralny,...} - słownik taki nie musi mieć kolejności alfabetycznej - komputerowi to niepotrzebne. Użyłem kolejności alfabetycznej, aby zobrazować ideę kompletności takiego słownika - żeby widać było jasno, że słownik musi zawierać wszystkie możliwe formy, nawet formy niepoprawne. Inny program, zwany Sztuczną Inteligencją, uzupełnia taki słownik, a robi to inteligentnie: SI stale przeszukuje Internet i jeśli znajdzie frazę: "canzura jest pożyteczna", wtedy dodaje do słownika słowo "canzura"... Ale chyba odpłynąłem - jakość inteligencji SI nas teraz nie interesuje. Skupmy się na naszym programie.

Mamy więc słownik, a więc początek działania programu. Program pobiera post do kontroli, pobiera ze słownika pierwsze słowo i porównuje je ze słowami z kontrolowanego postu. Jeśli trafi w poście na pasujące słowo, to usuwa cały post. A co program robi ze słowem, które pobrał? Oto jest pytanie... Dzisiaj taki program robi coś bez sensu, a powinien zrobić coś z sensem... I tak oto doszliśmy do naszego celu - do unijnej tresury.

Jak zwykle zacznę od razu od kawy na ławie. Co zrobić pożytecznego z pobranym słowem? Załóżmy, że program pobrał właśnie słowo "cenzorowy" i znalazł jest w poście, i usunął post... i zamierza teraz jakoś przygotować się do kontroli następnego postu. Może nic z tym słowem nie robić - czyli po prostu oczyści miejsce do pobrania. Potem pobierze kolejny post do kontroli, pobierze kolejne słowo ze słownika i przyłoży je do tego postu...

Aż tak słaby taki program z pewnością nie jest. Coś robi ze słowem "cenzorowy", zanim pobierze kolejny post do kontroli, np. wrzuca je do jakiejś hurtowni danych, gdzie robi się statystyki użycia słów i fraz zakazanych.

Niestety, dzisiaj program nie robi tego co najważniejsze - nie robi tego, co jest tą kawą na ławie, którą przed Wami kładę. Oto co powinien robić: Powinien wrzucić słowo "cenzorowy" do szablonu treści maila: "Nasz program, dbający o wysoką jakość postów, usunął Twój post, ponieważ zawierał on niedozwoloną frazę "cenzorowy". Taki mail powinien automatycznie zostać wysłany do autora usuniętego postu (chyba, że autor postu nie ma żadnego dostępnego adresu)

Jak myślicie, czy unijni rozumieją różnicę między człowiekiem, a zwierzęciem? Czy tresowanie ludzi, bez komunikacji z nimi, jest skuteczną metodą dbania o wysoką jakość postów. Każdy człowiek przyzwoity rozumie (słabo znam świat, ale Polaków znam, więc na pewno każdy przyzwoity Polak), że wyrzucanie cudzego tekstu do kosza bez choćby słowa wyjaśnienia, jest czymś skrajnie niestosownym. Podobno nawet w PRL cenzura zwykle informowała autora, za co tekst odrzuciła i co trzeba w nim zmienić, żeby go nie odrzuciła.

Praktycznie nic nie kosztuje taki automat wysyłający maile, więc jest oczywiste, że programy, dbające o wysoką jakość postów, nie korzystają z takich automatów, ponieważ unijni władcy z jakichś powodów celowo traktują Europejczyków jak zwierzęta, a nie jak ludzi. Unijna biurokracja traktuje nas gorzej niż traktowały nas nasze sowieckie władze 40 lat temu.