jmalos jmalos
103
BLOG

Niebezpieczne zabawy z tekstem

jmalos jmalos Technologie Obserwuj notkę 0

W szczytowym dla wydawnictw książkowych  2019 roku  liczba nowych tytułów książkowych w Polsce wynosiła  ok  36 tys. Od tego czasu liczba nowych tytułów książkowych się ustabilizowała a łączny nakład książek już nawet spada. Podobne spadkowe tendencje obserwujemy w wydawnictwach prasowych oraz w ilości dokumentów papierowych będących w obiegu administracji państwowej. Okres dominacji drukowanego papieru powoli się kończy. 

Nie oznacza  to że informacja tekstowa jest już całkiem w odwrocie. Słowo pisane, coraz bardziej zanieczyszczone, wlewa się obecnie olbrzymią rzeką do  serwisów   www. W 2020 roku w Polsce działało około 900 tysięcy serwisów WWW. W 2024 roku liczba zarejestrowanych domen wyniosła 2,59 miliona.  Większość  z zarejestrowanych serwisów www udostępnia właśnie informację tekstową.

Aby dominacja informacji tekstowej na serwisach www była nieszkodliwa (w życiu społecznym i gospodarczym) tekst powinien być pisany z głową.

Niestety rzeczywistość jest inna.

Dzięki łatwości  i powszechności publikacji www , obecnie przekaz tekstowy  przeważnie nie jest tworzony z głową, bo nie ma takiej potrzeby. Informacja w serwisach www jest wielokrotnie  powielana i wielokrotnie  zniekształcania przy aplauzie lajkujących obserwatorów.

Innym bardzo niebezpiecznym zjawiskiem w publikowaniu  informacji tekstowej  jest  jej oderwanie, odklejenie od jakiegokolwiek modelu informacyjnego.

Aby podołać wyzwaniom obecnego świata (w tym konkurencyjności gospodarki) informacja tekstowa musi być połączona z modelem obiektowym odwzorowującym  rzeczywistość. Inaczej mówiąc przekazywany  tekst powinien być głównie  interfejsem do świata obiektowych modeli danych.

Objaśnijmy to na przykładach.

PRZYKŁAD 1

Załóżmy że zostało   zrelacjonowane konkretne zdarzenie. Następnie zdarzenie to zostało skopiowane i z "lekkim przetworzeniem" opublikowane   na innych stronach www jako "nowe źródło informacji".

Rozważmy przypadki z różnym  poziomem  odwołania do modelu danych.

Przypadek I - Potok słów, brak modelu informacyjnego

 Opis początkowy (oryginał):
    Wczoraj wieczorem Tomek widział, jak kot wskoczył na dach sąsiedniego domu.   Chwilę później z dachu spadła doniczka i rozbiła się na chodniku. Sąsiadka, która to zobaczyła, zaczęła krzyczeć na kota.  Kot uciekł na drzewo, a potem długo nie chciał zejść. Straż pożarna musiała przyjechać, żeby go ściągnąć.

Opis końcowy (kolejna  kopia informacji):
Kot coś zniszczył na dachu, ludzie się zbiegli, była awantura. Kot wlazł gdzieś wysoko i trzeba było straży pożarnej. Ktoś mówił, że nawet policja była.

W podanym przykładzie z powodu użycia do opisu zdarzenia wyłącznie słów (bez połączenia z modelem informacyjnym)  informacja końcowa  została całkowicie zniekształcona.
Pojawia się policja, "awantura", zatarte są szczegóły (np. doniczka, rola Tomka), a ogólny ton staje się bardziej dramatyczny. To pokazuje, jak łatwo fakty mieszają się z interpretacjami i wyobrażeniami kolejnych osób w łańcuchu komunikacyjnym.


Przypadek 2 - Potok słów, bardzo prosty parametryczny  model informacyjny

Opis początkowy (oryginał):
Wczoraj o 18:45 w parku miejskim złamało się jedno z drzew podczas burzy. Drzewo miało około 12 metrów wysokości.
Nikt nie został ranny, ale uszkodzone zostały dwie ławki i jedna lampa.Straż miejska przyjechała o 19:10.
Sprzątanie trwało do 20:30.

Opis końcowy

W parku o 18:45 przewróciło się drzewo o wysokości 12 metrów. Zniszczyło dwie ławki i lampę. Nikt nie został ranny. Straż miejska przyjechała o 19:10, sprzątanie zakończyło się o 20:30.

Mimo pewnych przesunięć w kolejności i stylu, kluczowe liczby (18:45, 12 metrów, 2 ławki, 1 lampa, 19:10, 20:30) pozostały nienaruszone. To pokazuje, że liczby pomagają „stabilizować” informację  i utrzymać większą dokładność przekazywania informacji.


Przypadek 3 -  Słowa w pełni nawiązują do modelu  informacyjnego


Opis początkowy – tabela zdarzenia:
Typ zdarzenia    Czas zdarzenia    Lokalizacja    Wynik zdarzenia    Uczestnicy    Identyfikator zdarzenia
Awaria    14:25    Stacja Trafo #12    Przerwa w dostawie prądu (45 min)    3 techników    EVT-2025-0517-A12
Opis końcowy (identyczny)

Typ zdarzenia    Czas zdarzenia    Lokalizacja    Wynik zdarzenia    Uczestnicy    Identyfikator zdarzenia
Awaria    14:25    Stacja Trafo #12    Przerwa w dostawie prądu (45 min)    3 techników    EVT-2025-0517-A12


W przykładzie 3 informacja  nawiązuje do   danych w ustrukturyzowanej tabeli, czyli przekaz jest jasny z jasno określonymi polami. Taka forma eliminuje  szum informacyjny i bałagan informacyjny, odbiorcy nie muszą interpretować ani parafrazować – wystarczy przeczytać dane.

PRZYKŁAD 2

Przykład 2 z obszaru  biznesu (usługi) , reklamacja   towaru

Załóżmy że klient kupił towar i zgłasza  reklamację w oparciu o różne modele informacyjne.

Poniżej tabela z zestawieniem  możliwych treści zgłoszenia (w zależności od modelu informacyjnego) oraz oceną efektywności obsługi reklamacji.

image


Jak widać z przykładu 2   w zależności od modelu informacyjnego mamy 4 poziomy obsługi klienta    od archaicznej formy językowo-tekstowej  gdzie nikt nic nie wie a pracownik obsługi reklamacji niewiele może pomóc , do przyszłościowego modelu obiektowego gdzie reklamacja jest w pełni odwzorowana przez co może być organizowana automatycznie,  bezobsługowo z włączeniem do diagnozy AI.

Podsumowanie BLOGA 

Druk traci znaczenie: od 2019 r. liczba nowych tytułów książkowych stoi w miejscu, a nakłady spadają; w prasie i administracji papier także cofa się do defensywy. Tymczasem Internet zalewa nas rekordową liczbą stron WWW (2,59 mln domen .pl w 2024 r.), które masowo powielają chaotyczny tekst.
Kluczowy problem: większość treści w sieci nie jest zakorzeniona w żadnym modelu danych, więc każde kopiowanie ją zniekształca. Pokazane trzy scenariusze (czysty potok słów → prosty model z liczbami → pełne powiązanie z tabelą zdarzenia) udowadniają, że tylko tekst spleciony z ustrukturyzowanymi danymi zachowuje wierność faktom. 

WNIOSKI KOŃCOWE 

 Tekst pozbawiony modelu danych to cyfrowy hałas powinniśmy to traktować jako  ODPAD, a nie jako właściwą treść.

  Instytucje państwowe  i firmy, które nadal produkują czysty, nieustrukturyzowany tekst, subsydiują własną nieefektywność i błyskawicznie tracą przewagę konkurencyjną.

    Brak edukacji w modelowaniu danych to hodowla cyfrowych analfabetów – lekcje „myślenia obiektowego” powinny zaczynać się w podstawówce, nie na studiach.

    Państwo, które nie postawi na infrastrukturę danych i tekst jako interfejs do modeli, skazuje się na rolę cyfrowej kolonii zależnej od importowanej technologii.




   








jmalos
O mnie jmalos

Nowości od blogera

Komentarze

Pokaż komentarze

Inne tematy w dziale Technologie