Niebezpieczne zabawy z tekstem

W szczytowym dla wydawnictw książkowych 2019 roku liczba nowych tytułów książkowych w Polsce wynosiła ok 36 tys. Od tego czasu liczba nowych tytułów książkowych się ustabilizowała a łączny nakład książek już nawet spada. Podobne spadkowe tendencje obserwujemy w wydawnictwach prasowych oraz w ilości dokumentów papierowych będących w obiegu administracji państwowej. Okres dominacji drukowanego papieru powoli się kończy.

Nie oznacza to że informacja tekstowa jest już całkiem w odwrocie. Słowo pisane, coraz bardziej zanieczyszczone, wlewa się obecnie olbrzymią rzeką do serwisów www. W 2020 roku w Polsce działało około 900 tysięcy serwisów WWW. W 2024 roku liczba zarejestrowanych domen wyniosła 2,59 miliona. Większość z zarejestrowanych serwisów www udostępnia właśnie informację tekstową.

Aby dominacja informacji tekstowej na serwisach www była nieszkodliwa (w życiu społecznym i gospodarczym) tekst powinien być pisany z głową.

Niestety rzeczywistość jest inna.

Dzięki łatwości i powszechności publikacji www , obecnie przekaz tekstowy przeważnie nie jest tworzony z głową, bo nie ma takiej potrzeby. Informacja w serwisach www jest wielokrotnie powielana i wielokrotnie zniekształcania przy aplauzie lajkujących obserwatorów.

Innym bardzo niebezpiecznym zjawiskiem w publikowaniu informacji tekstowej jest jej oderwanie, odklejenie od jakiegokolwiek modelu informacyjnego.

Aby podołać wyzwaniom obecnego świata (w tym konkurencyjności gospodarki) informacja tekstowa musi być połączona z modelem obiektowym odwzorowującym rzeczywistość. Inaczej mówiąc przekazywany tekst powinien być głównie interfejsem do świata obiektowych modeli danych.

Objaśnijmy to na przykładach.

PRZYKŁAD 1

Załóżmy że zostało zrelacjonowane konkretne zdarzenie. Następnie zdarzenie to zostało skopiowane i z "lekkim przetworzeniem" opublikowane na innych stronach www jako "nowe źródło informacji".

Rozważmy przypadki z różnym poziomem odwołania do modelu danych.

Przypadek I - Potok słów, brak modelu informacyjnego

Opis początkowy (oryginał):
Wczoraj wieczorem Tomek widział, jak kot wskoczył na dach sąsiedniego domu. Chwilę później z dachu spadła doniczka i rozbiła się na chodniku. Sąsiadka, która to zobaczyła, zaczęła krzyczeć na kota. Kot uciekł na drzewo, a potem długo nie chciał zejść. Straż pożarna musiała przyjechać, żeby go ściągnąć.

Opis końcowy (kolejna kopia informacji):
Kot coś zniszczył na dachu, ludzie się zbiegli, była awantura. Kot wlazł gdzieś wysoko i trzeba było straży pożarnej. Ktoś mówił, że nawet policja była.

W podanym przykładzie z powodu użycia do opisu zdarzenia wyłącznie słów (bez połączenia z modelem informacyjnym) informacja końcowa została całkowicie zniekształcona.
Pojawia się policja, "awantura", zatarte są szczegóły (np. doniczka, rola Tomka), a ogólny ton staje się bardziej dramatyczny. To pokazuje, jak łatwo fakty mieszają się z interpretacjami i wyobrażeniami kolejnych osób w łańcuchu komunikacyjnym.

Przypadek 2 - Potok słów, bardzo prosty parametryczny model informacyjny

Opis początkowy (oryginał):
Wczoraj o 18:45 w parku miejskim złamało się jedno z drzew podczas burzy. Drzewo miało około 12 metrów wysokości.
Nikt nie został ranny, ale uszkodzone zostały dwie ławki i jedna lampa.Straż miejska przyjechała o 19:10.
Sprzątanie trwało do 20:30.

Opis końcowy

W parku o 18:45 przewróciło się drzewo o wysokości 12 metrów. Zniszczyło dwie ławki i lampę. Nikt nie został ranny. Straż miejska przyjechała o 19:10, sprzątanie zakończyło się o 20:30.

Mimo pewnych przesunięć w kolejności i stylu, kluczowe liczby (18:45, 12 metrów, 2 ławki, 1 lampa, 19:10, 20:30) pozostały nienaruszone. To pokazuje, że liczby pomagają „stabilizować” informację i utrzymać większą dokładność przekazywania informacji.

Przypadek 3 - Słowa w pełni nawiązują do modelu informacyjnego

Opis początkowy – tabela zdarzenia:
Typ zdarzenia Czas zdarzenia Lokalizacja Wynik zdarzenia Uczestnicy Identyfikator zdarzenia
Awaria 14:25 Stacja Trafo #12 Przerwa w dostawie prądu (45 min) 3 techników EVT-2025-0517-A12
Opis końcowy (identyczny)

Typ zdarzenia Czas zdarzenia Lokalizacja Wynik zdarzenia Uczestnicy Identyfikator zdarzenia
Awaria 14:25 Stacja Trafo #12 Przerwa w dostawie prądu (45 min) 3 techników EVT-2025-0517-A12

W przykładzie 3 informacja nawiązuje do danych w ustrukturyzowanej tabeli, czyli przekaz jest jasny z jasno określonymi polami. Taka forma eliminuje szum informacyjny i bałagan informacyjny, odbiorcy nie muszą interpretować ani parafrazować – wystarczy przeczytać dane.

PRZYKŁAD 2

Przykład 2 z obszaru biznesu (usługi) , reklamacja towaru

Załóżmy że klient kupił towar i zgłasza reklamację w oparciu o różne modele informacyjne.

Poniżej tabela z zestawieniem możliwych treści zgłoszenia (w zależności od modelu informacyjnego) oraz oceną efektywności obsługi reklamacji.

Jak widać z przykładu 2 w zależności od modelu informacyjnego mamy 4 poziomy obsługi klienta od archaicznej formy językowo-tekstowej gdzie nikt nic nie wie a pracownik obsługi reklamacji niewiele może pomóc , do przyszłościowego modelu obiektowego gdzie reklamacja jest w pełni odwzorowana przez co może być organizowana automatycznie, bezobsługowo z włączeniem do diagnozy AI.

Podsumowanie BLOGA

Druk traci znaczenie: od 2019 r. liczba nowych tytułów książkowych stoi w miejscu, a nakłady spadają; w prasie i administracji papier także cofa się do defensywy. Tymczasem Internet zalewa nas rekordową liczbą stron WWW (2,59 mln domen .pl w 2024 r.), które masowo powielają chaotyczny tekst.
Kluczowy problem: większość treści w sieci nie jest zakorzeniona w żadnym modelu danych, więc każde kopiowanie ją zniekształca. Pokazane trzy scenariusze (czysty potok słów → prosty model z liczbami → pełne powiązanie z tabelą zdarzenia) udowadniają, że tylko tekst spleciony z ustrukturyzowanymi danymi zachowuje wierność faktom.

WNIOSKI KOŃCOWE

Tekst pozbawiony modelu danych to cyfrowy hałas powinniśmy to traktować jako ODPAD, a nie jako właściwą treść.

Instytucje państwowe i firmy, które nadal produkują czysty, nieustrukturyzowany tekst, subsydiują własną nieefektywność i błyskawicznie tracą przewagę konkurencyjną.

Brak edukacji w modelowaniu danych to hodowla cyfrowych analfabetów – lekcje „myślenia obiektowego” powinny zaczynać się w podstawówce, nie na studiach.

Państwo, które nie postawi na infrastrukturę danych i tekst jako interfejs do modeli, skazuje się na rolę cyfrowej kolonii zależnej od importowanej technologii.