kameleon kameleon
91
BLOG

Jak słucha Kameleon? - nagrania z CVR - Tu154m

kameleon kameleon Polityka Obserwuj notkę 2
katastrofa smoleńska

Wielokrotnie pytano mnie tu na S24 w jaki sposób odszumiam nagrania z CVR z lotu Tu154m do Smoleńska dnia 10.04.2010.

Dziś przedstawię w skrócie jak to robię i jakich narzędzi używam, aby odszumić dany fragment nagrania używając tylko programu Audacity.

Ostatnio notkę na mój temat napisał bloger quwerty, gdzie podważa moje odczyty, ponieważ twierdzi, że ani on, ani jego "przyjaciółka" AI  w zamieszczanych przeze mnie odszumionych fragmentach nic nie słyszą.

Jego zdaniem mam omamy i zwidy, ponieważ tego co zaszumione nie da się odczytać(?)

Uważam że jest w wielkim błędzie, a to że coś jest bardzo trudne do zrobienia, nie znaczy że nie można tego zrobić.

Tu link do jego notki:

https://www.salon24.pl/u/niegracz/1440488,zwidy-blogerki-kameleon-a-mozliwosc-odczytu-rozmow-smolensk

.

Może najpierw o tym - czym są spektrogramy?

- dają obraz - pokazują wizulanie dżwięk (częstotliwość vs czas)

- pomagają lokalizować spółgłoski wybuchowe, szept, puknięcia, szmery

- ALE - nie rozróżniają intencji, nie rozumieją kontekstu


Przykład spektrogramu:

image

Jednak zbyt duże zakłócenia i szumy mogą zafałszować spektrogram, przez co:

1. Prawdziwe dżwięki (np.wypowiedzi) mogą zostać zakryte przez silniejszy szum - wtedy widzimy tylko "mgłę" w tle albo fałszywe wzorce

2. Szum może wygenerować artefakty, które przypominają słowa, impulsy czy zdarzenia (np.ktoś może błędnie uznać je za "strzał', "wybuch", "słowo"itp.).

3. Filtry redukujące szum mogą przypadkowo wyciąć fragmenty prawdziwej wypowiedzi, zwłaszcza jeśli pasmo głosu pokrywa się z szumem.

4. Dynamiczne zmiany poziomu głośności (kompresja, automatyczne wzmacnianie) mogą "rozciągnąć tło i sprawić, że coś brzmi i wygląda na spektrogramie inaczej niż było.

5. Rozdzielczość czasowa vs częstotliwościowa - spektrogram zawsze balansuje między tymi dwoma - im lepiej widać zmiany w czasie, tym gorzej widać dokładne częstotliwości.

Spektrogram pokazuje kiedy dżwięk się pojawił, ale nie mówi co go spowodowało. Interpretacja wymaga wiedzy i często porównań. Spektrogramy można zmanipulować, przy odpowiednim oprogramowaniu możliwe jest zmanipulowanie zarówno nagrania, jak i jego widma, co ma znaczenie na przykład w analizie śledczej.

Tak więc podsumowując, spektrogramy dżwięku i widma dżwiękowe są pomocne, ale nie są dowodem absolutnym i nie są w 100% dokładne. Są bardzo użytecznymi narzędziami, ale mają swoje ograniczenia i zawsze powinny być traktowane tylko jako pomocnicze.

Dlatego przy analizie nagrań dżwiękowych najlepiej jest:

- stosować DOKŁADNE odszumianie, najlepiej pasmowe i selektywne

- unikać nadmiernego stosowania filtrów, które moga usunąć bądż zniekształcić istotne treści

- korzystać z kilku metod, nie tylko spektrogramu


 A teraz napiszę trochę o tym jak ja pracuję z dżwiękiem.

Kolejność działań - oczyszczanie, przez kształowanie, do wyrównania.

Dzięki temu:

- nie wzmacniam szumu, tylko sygnał

- poprawiam zrozumiałość bez sztuczności

- zachowuję naturalne brzmienie głosu( co jest bardzo ważne w analizie)


Mój sposób odszumiania można nazwać "audio archeologią' - cierpliwe odsłanianie głosu spod warstw zakłóceń, bez niszczenia materiału dżwiękowego.

1. Odszumianie pasmowe i selektywne - pozwala usuwać tylko te zakresy częstotliwości, które rzeczywiście zawierają szum, zachowując maksimum oryginalnego sygnału(np. głosu). To minimalizuje ryzyko usunięcia ważnych informacji.

2. Praca na krótkich fragmentach - pozwala precyzyjnie kontrolować to co analizuję, i zauważyć niuanse, które łatwo przeoczyć w dłuższym materiale.

3. Łączenie odczytów w całość - często pojedynczy fragment jest niejasny, ale w kontekście poprzedniego/następnego staje się zrozumiały.


Krok po kroku moja metoda odszumiania i wzmacniania nagrań w Audacity - przykład:

1. Normalizacja (na początek) - wstępne wyrównanie poziomu głośności, aby ułatwić dalszą pracę - poziom docelowy  -1,0 dB

2. Usunięcie szumów (Noise Reduction):

- pobranie profilu szumu 

- redukcja szumu 6dB

- wygładzanie pasma (Frequency Smoothing) 3 - 6 dB

- delikatne oczyszczenie, aby nie usunąć detali tła

3. Equalizer (wzmocnienie pasma głosu):

- podbicie +6 dB

- ułatwia wyłapanie cichych słów i dżwięków z tła, są lepiej słyszalne

4. Drugi raz - normalizacja dżwięku(poziom sygnału do -1dB), czyli ponowne wyrównanie poziomów po equalizacji, zapobiega przesterowaniu dżwięku

5. Drugi raz użycie Equalizera :

- kolejne podbicie +6dB (jeśli dany fragment tego wymaga, tylko tam, gdzie sygnał jest nadal słaby)

- czasem tylko w wybranym zakresie (np.pasmo cichych wypowiedzi)

6. Dodatkowe odszumienie i wygładzenie (opcjonalnie):

- jeśli dany fragment zawiera nadal niezrozumiałe wypowiedzi, stosuję jeszcze raz redukcję szumu i/lub delikatne wygładzenie

- czasem odsłuchuję w zwolnionym tempie lub z podkreśleniem wybranego pasma


 W skrócie:

1. Redukcja szumów(delikatna)- usuwa szumy bez niszczenia głosów - (redukcja od 6 do 10 dB, czułość 4 - 6, wygładzanie 3-6 pasm) - zastosowanie takich ustawień przy złej jakości nagrań jest zasadne moim zdaniem

2.Equalizer(EQ) - koryguje barwę i podbija wyrazistość (np. lekkie podbicie pasm głosu)

3. Wzmocnienie(Gain)- dodaję 6dB, co daje lepszą słyszalność bez przesterów

4.Normalizacja - wyrównuje końcowy poziom, nadaje nagraniu "radiową" równowagę

5. Nie robię przesadnego "wybielania "dżwięku, co jest niestety częstym błędem amatorów


Zalety tej metody:

- praca na słuchu -  nie na graficznych "domysłach", można wyłapać to czego nie wychwycą algorytmy

- warstwowe podejście - działa jak audio- pędzel archeologa 

- elastyczność - reakcja na konkretne fragmenty, działanie nieszablonowe

- brak nadmiernego filtrowania chroni autentyczność nagrania- zbyt "inteligentne" algorytmy często wycinają fragmenty głosu, zmieniają barwę albo zostawiają artefakty

- skupienie się na brzmieniu i zrozumiałości - dotarcie do treści, a nie tylko do kształtów fal i wykresów - spektrogramy nie powiedzą, co naprawdę powiedział człowiek, jesli tego dobrze nie słychać

- stopniowe odszumianie pozwala kontrolować efekt - lepiej odszumiać w małych krokach niż jednym agresywnym filtrem, który może zniszczyć dżwięk 


Także, jak już kiedyś wspomniałam blogerowi Jaworskiemu, nie ma tu żadnych cudów a zasady są bardzo proste.

Jednak ta metoda odszumiania ma jeden poważny minus, ponieważ jest pracochłonna.

Wymaga mnóstwa cierpliwości, precyzji i czasu.

Chciałabym również podkreślić, że cała moja praca opiera się na odpowiedzialności i szacunku do dowodów.

Nie traktuję tej analizy jako spekulacji, lecz jako staranne badanie materiału, który może dać istotne informacje w kontekście katastrofy smoleńskiej. Nie roszczę sobie prawa do absolutnej pewności, ale zawsze staram się wyciągnąć najrzetelniejsze wnioski z dostępnych materiałów.

Moim celem jest uzyskanie jak najczystszych i najbardziej wiarygodnych wyników, które mogą przyczynić się do pełniejszego zrozumienia tamtego tragicznego wydarzenia z 10 kwietnia 2010 roku.

Ps. Zgodnie z tym co napisałam w komentarzu pod tą notką zamieszczam do porównania fragment nagrania z TVN24 z programu red.Piotra Świerczka"Siła dżwięku" z  fragmentem odszumionym moją metodą .

Tu link do tego materiału "Siła dżwięku":

https://tvn24.pl/polska/ostatnie-38-minut-lotu-nagranie-z-kabiny-prezydenckiego-tupolewa-ra636030-ls3178697

(fragment  zaczyna się od 26:08)

Tak odczytali go biegli :

-"Także proszę już myśleć nad decyzją co będziemy robili" - Dowódca 

-"Będziemy próbowali do skutku" - Dyrektor Protokołu Dyplomatycznego 


Tutaj próbka z tego nagrania:

https://uploadfile.pl/pokaz/2345321---dvbt.html

.

A tu mój odczyt tego fragmentu :

-"Także proszę już iść"

-"Jaka decyzja?"

-"Krąg będziemy robili"

-"Na ziemi mgła'

-"Na północnym mgły"


I odszumiony fragment:

https://uploadfile.pl/pokaz/2345322---wb4z.html

.

Wypowiedzi z tego fragmentu:

1."Takzę proszę już iść"

https://uploadfile.pl/pokaz/2345323---3sg1.html


2."Takzę proszę już iść""Jaka decyzja?"-"Krąg będziemy robili"

https://uploadfile.pl/pokaz/2345324---kpqy.html


3."Na ziemi mgła"- "Na północnym mgły"

https://uploadfile.pl/pokaz/2345325---rukj.html


4."Na ziemi mgła"

https://uploadfile.pl/pokaz/2345326---i8xr.html

.

Wnioski:

1. Na materiał z TVN24 został narzucony świszczący dzwięk, który zagłuszył i zniekształcił wypowiedzi nadając im  wibrujące,"świszczące" brzmienie.

Dżwięk jest przesterowany i nienaturalny, przez co nie słychać prawie wypowiedzi cichszych i głosów z tła.

2. Wypowiedzi moim zdaniem zostały odczytane błędnie.

3. Mój odczyt zmienia całkowicie kontekst sytuacyjny, gdzie to Dowódca mówi "Także proszę już iść " do M.Kazany.

Kazana pyta Dowódcę"Jaka decyzja?", na co ten  mu odpowiada "Krąg będziemy robili".

Kazana mówi "Na ziemi mgła" i ktoś w tle "Na północnym mgły".

4. Nie ma w tym fragmencie, jak to ustalili biegli,  wypowiedzi o nacisku Kazany na załogę "Będziemy próbować do skutku".To krzywdząca Kazanę wypowiedż, która pośrednio obciążyła go winą za wypadek. Ukazano go jako osobę zdeterminowaną, aby wymusić słownie na pilotach decyzję o lądowaniu.

5.Mój odszumiony fragment  nie zawiera świszczącego dżwięku .Dżwięk jest naturalny bez szumów, a wypowiedzi są zrozumiałe .

6. Praca z odszumianiem krótkich fragmentów, pomimo tego że zajmuje sporo czasu, daje dokładniejsze efekty.


Podsumowanie .

Fragment materiału dżwiękowego wyemitowanego przez TVN24 przywołałam tu dla porównania.

Nie chodzi tu o oskarżenia, lecz o ilustrację różnicy między przekazem medialnym  a odszumionym nagraniem.

Moim celem nie jest inerpretowanie emocji, lecz ukazanie, jak precyzyjna praca z dżwiękiem może przybliżyć nas do prawdy.


kameleon
O mnie kameleon

Nowości od blogera

Komentarze

Pokaż komentarze (2)

Inne tematy w dziale Polityka