R 14 07, HTML
[ Pobierz całość w formacie PDF ]
Rozdział 14.
Dźwięk i obraz wideo
Spędzając miłe popołudnie na buszowaniu po sieci, odkrywasz nagle stronę zawierającą
długą listę animacji, z których chciałbyś skorzystać. Świetnie, myślisz, i przeglądasz li-
stę tytułów. I tu pojawia się problem: przy każdym z tytułów widnieje krótki opis, na
przykład, taki:
‘Luther’s Banana’ is a 1.2 megabyte AVI file with a CinePak codec and an
8-bit 22KHz two channel audio track.
Jeżeli rozumiesz ten opis, nie musisz czytać tego rozdziału. Przeczytaj, jeśli chciałbyś
się dowiedzieć czegoś o dźwięku i obrazie w powiązaniu z sieciami lub, gdy zdecydo-
wałeś, że musisz poznać znaczenie tych wszystkich dziwnych słów i liczb.
W tym rozdziale będziemy zajmować się cyfrowym dźwiękiem i obrazem wideo: jak
działają, w jakich formatach można je przechować i które z nich nadają się do zastoso-
wań sieciowych. Znajdziesz także kilka sugestii, skąd wziąć obraz i dźwięk oraz jak
wykorzystać go na Twoich stronach sieciowych. Oto niektóre z tematów, jakie zostaną
tu omówione:
cyfrowy dźwięk i obraz; podstawowe wiadomości,
popularne formaty zapisu dźwięku: MP3, Wave oraz RealAudio,
popularne formaty zapisu obrazu wideo: QuickTime, Video for Windows, MPEG
oraz RealAudio,
systemy kodowania obrazu wideo; jak działają, które z nich są najpopularniejsze
i najbardziej przydatne,
jak tworzyć pliki dźwiękowe i wideo na użytek sieci.
Dźwięk — wiadomości podstawowe
Czy chcesz dowiedzieć się czegoś na temat dźwięku w komputerach? Nauczyć się two-
rzyć własne pliki dźwiękowe z muzyką, głosem, efektami specjalnymi lub innymi
dziwnymi hałasami? Jeśli tak, czytasz właściwy tekst. W pierwszej części tego rozdzia-
łu dowiemy się kilku rzeczy o cyfrowym dźwięku w ogóle i o popularnych w sieci for-
matach plików, w których można go zapisywać. Opowiemy też o tym, jak na własny
użytek zapisać dźwięk w formacie cyfrowym i jak wprowadzić go do sieci.
402
Część 5.
Multimedia i aplety Javy
Fale dźwiękowe
Być może pamiętasz z lekcji fizyki, że dźwięk to drgania powietrza, rozchodzące się
w postaci fali. Te drgania ludzkie ucho rejestruje jako dźwięk. Najprostsza fala dźwię-
kowa mogłaby wyglądać tak, jak to pokazuje rysunku. 14.1.
Rysunek 14.1.
Prosta fala dźwiękowa
O fali dźwiękowej musimy wiedzieć dwie ważne rzeczy. Po pierwsze, ma zawsze pew-
ną amplitudę, definiowaną jako odległość od linii środkowej (oznaczającej wartość ze-
rową dźwięku, czyli ciszę) do najwyższego lub najniższego punktu fali. Im większa
amplituda, tym głośniejszy dźwięk.
Po drugie, ma również częstotliwość, która określa prędkość, z jaką porusza się fala
(lub bardziej precyzyjnie — ilość fal przechodzących przez określony punkt w jednost-
ce czasu). Przy wysokich częstotliwościach — tj. gdy fala przemieszcza się prędzej —
słyszymy dźwięki wysokie, przy niskich, głębokie tony.
Prawdziwe dźwięki są znacznie bardziej skomplikowane niż ten opisany przez nas. Są
one sumą wielu różnych, nakładających się na siebie fal. Amplituda i częstotliwość są
jednak wśród tych wszystkich pojęć najważniejsze.
Konwersja fali dźwiękowej do postaci cyfrowej
Analogowa fala dźwiękowa (taka jak na rysunku 14.1) jest ciągłą linią. Poruszając się
wzdłuż niej, możemy odczytać nieskończenie wiele wartości amplitudy. Aby prze-
kształcić taką falę do postaci cyfrowej, komputer musi zmierzyć amplitudę w określo-
nych odstępach czasowych. Każda zmierzona wartość amplitudy nazywana jest próbką
(
sample
). Dlatego właśnie proces przekształcania dźwięku do postaci cyfrowej nazywa-
ny jest próbkowaniem dźwięku (ang.
sampling
). Rysunek 14.2 przedstawia, jak odczy-
tywane są wartości amplitudy fali przy próbkowaniu.
Rysunek 14.2.
Próbkowanie dźwięku
Im więcej pobierzemy próbek, tym dokładniej uda nam się odwzorować prawdziwy
kształt fali i tym doskonalszą jej imitację otrzymamy. Nie będzie to jednak identyczny
dźwięk. Ponieważ oryginalna fala posiada nieskończenie wiele różniących się amplitud,
Rozdział 14.
Dźwięk i obraz wideo
403
nigdy nie uda nam się jej odtworzyć całkowicie wiernie. Jeżeli jednak pobierzemy
próbki bardzo gęsto, osiągniemy tak duże podobieństwo do pierwowzoru, że ludzkie ucho
nie zdoła wychwycić różnicy.
Ilość próbek pobieranych w ciągu sekundy zwana jest częstotliwością próbkowania (
sample
rate
). Zwykle mierzymy tę częstotliwość w kilohercach (kHz). Obecnie używa się kilku
różnych częstotliwości próbkowania; najpopularniejsze z nich to 11 kHz, 22 kHz i 44 kHz.
Liczby te są zaokrąglane dla wygody. Rzeczywiście używane częstotliwości wynoszą 11,025
kHz, 22,050 kHz i 44,1 kHz.
Oprócz częstotliwości próbkowania (
sample rate
)
mamy też rozmiar próbkowania
(
sample size
), zwany też rozdzielczością próbkowania (
sample resolution
)
.
Ogólnie
rzecz biorąc, do wyboru są dwie rozdzielczości: 8-bitowa i 16-bitowa. Rozdzielczość
próbkowania należy sobie wyobrażać jako ilość pionowych odcinków, na które dzieli-
my amplitudę fali przy jej pomiarze, od dolnego do górnego wierzchołka.
Wartości, które chcemy mierzyć, same nie są zależne od przyjętej rozdzielczości, ale
dokładność naszego pomiaru — tak. Jeśli do pomiaru, zamiast ośmioodcinkowej „po-
działki”, zastosujemy szesnastoodcinkową, będziemy mogli odwzorować mniejsze róż-
nice amplitudy i uzyskamy wierniejszy obraz (patrz rysunek 14.3). To zupełnie tak sa-
mo, jak z 16-bitowym i 24-bitowym kolorem. 24-bitowa paleta barw jest bogatsza i po-
zwala lepiej odwzorowywać subtelne odcienie, ale także, korzystając z palety 16-bito-
wej, możemy odtworzyć kolory oryginału z niezłym przybliżeniem.
Rysunek 14.3.
Rozdzielczość
próbkowania
Częstotliwość próbkowania
to liczba „próbek” dźwięku pobieranych na sekundę przy
mierzeniu amplitudy fali. Wyrażamy ją w kilohercach (kHz).
Rozdzielczość próbkowania
jest
zwykle 8-bitowa lub 16-bitowa. Ta druga rozdzielczość pozwala dokładniej zapisać wynik
pomiaru, dzięki czemu możemy lepiej odwzorować oryginalny dźwięk.
Przy pobieraniu próbki dźwięku, rzeczywista wielkość zmierzonej amplitudy zaokrą-
glana jest do najbliższej kreski „podziałki”. W żargonie specjalistów określa się to jako
kwantowanie(ang.
quantizing
). Jeśli korzystamy z 16-bitowej rozdzielczości próbkowa-
nia, mamy o wiele większą szansę, że zapisana wartość będzie bliższa zmierzonej warto-
ści oryginalnej niż wtedy, gdy pracujemy z rozdzielczością 8-bitową (patrz rysunek 14.4).
404
Część 5.
Multimedia i aplety Javy
Rysunek 14.4.
Pobieranie
próbki dźwięku
Różnica pomiędzy oryginalną wartością, a zapisanym, zaokrąglonym wynikiem pomia-
ru zwana jest
błędem kwantowania
(ang.
quantization error
— to jeszcze jeden termin
ze specjalistycznego żargonu). Duża ilość błędów kwantowania powoduje powstawanie
świszczącego pogłosu w ostatecznie uzyskanym pliku audio.
Wszystko to, co powiedzieliśmy przed chwilą w tak zawiły sposób, sprowadza się do
jednego prostego twierdzenia: 16 bitów jest lepsze niż 8 bitów. Po co więc było tyle ga-
dać? No cóż, przynajmniej teraz wiesz dlaczego. Ogólna jakość dźwięku cyfrowego jest
powiązana zarówno z częstotliwością próbkowania
(
sample rate
), jak i rozdzielczością
próbkowania (
sample size
)
.
Ponieważ jednak ludzkie ucho łatwiej wychwytuje błędy
wynikające ze zbyt niskiej rozdzielczości, niż te, wynikające ze zbyt niskiej częstotli-
wości, należy przede wszystkim zwrócić uwagę na rozdzielczość. Jeśli to możliwe,
zawsze korzystaj z rozdzielczości 16-bitowej, a nie 8-bitowej. Pracując w 8 bitach, uży-
waj największej z dostępnych częstotliwości próbkowania — pozwoli Ci to częściowo
zrekompensować błędy.
Musisz także wiedzieć, że na jakość dźwięku ma wpływ również ilość kanałów, jakie
zapiszemy. Dźwięk można bowiem zapisywać przy użyciu wielu kanałów, zwykle czy-
ni się tak w celu uzyskania stereofonicznego efektu. Przy jednym kanale mamy do czy-
nienia z dźwiękiem mono, przy dwóch mamy stereo, przy czterech kwadrofonię i tak
dalej. Zupełnie tak, jak w Twoim odbiorniku radiowym.
Im wyższa częstotliwość próbkowania, im wyższa rozdzielczość i im większa liczba kana-
łów, tym lepszej jakości dźwięk otrzymujemy. Przykładowo, dźwięk zapisany przy roz-
dzielczości 8-bitowej i częstotliwości próbkowania 8 kHz przypomina to, co zwykle sły-
szymy przez telefon. Natomiast 16-bitowy dźwięk stereofoniczny o częstotliwości 44 kHz
odpowiada już standardowi CD. Niestety, zupełnie tak, jak w przypadku obrazów, lepsza
jakość oznacza większe rozmiary pliku. Minuta 8-bitowej muzyki o częstotliwości 22 kHz
zajmie około 1,25 MB na Twoim dysku, zaś minuta muzyki o jakości typowej dla odtwa-
rzacza CD (16 bitów, 44 kHz) zajmie około 10 MB. Jak łatwo zgadnąć, stereo zajmie dwa
razy więcej miejsca niż mono.
A co z kompresją? Jeżeli pliki audio zajmują tyle miejsca, dlaczego nie postąpić tak, jak
to uczynili specjaliści od komputerowej grafiki i nie opracować mechanizmów kompre-
sji, które pozwolą zredukować rozmiary plików? Niestety, jak twierdzą eksperci w tej
dziedzinie (a nam wypada wierzyć im na słowo), pliki audio są niezmiernie trudne do
Rozdział 14.
Dźwięk i obraz wideo
405
skompresowania. W gruncie rzeczy nie ma w tym nic dziwnego, jeśli wziąć pod uwagę,
jak bardzo złożone są fale dźwiękowe. Nie możemy w tym przypadku liczyć na odszu-
kanie jakichś powtarzających się wzorów i jednolitych obszarów, które tak znakomicie
ułatwiają kompresowanie obrazów. Wśród popularnych formatów zapisu dźwięku jest
zaledwie kilka takich, które mają wbudowany mechanizm kompresji.
Odtwarzanie dźwięku cyfrowego w postaci analogowej
Udało nam się zakodować analogowy dźwięk w cyfrowej postaci. Teraz chcemy go od-
tworzyć. Komputer staje przed zadaniem przetworzenia zakodowanych danych — sze-
regu cyfrowych „próbek” dźwięku z powrotem do postaci analogowej fali.
Cyfrowy dźwięk składa się z milionów zapisanych próbek, z których każda odtwarzana
jest przez określony odcinek czasu (ten sam, w jakim przedtem próbka została pobrana).
Ponieważ w tym czasie zapisana wartość amplitudy dźwięku pozostaje stała, wytwarzana
fala dźwiękowa ma zębaty, poszarpany kształt, a dźwięk brzmi nieco dziwacznie (patrz
rysunek 14.5).
Rysunek 14.5.
Poszarpany
sygnał analogowy
Z tego powodu stosuje się specjalne filtry analogowe, które wygładzają kształt fali
dźwiękowej (patrz rysunek 14.6) wysyłanej z głośników Twojego komputera.
Rysunek 14.6.
Sygnał po wygładzeniu
Popularne formaty zapisu dźwięku
Teraz, gdy już wiemy, czym jest cyfrowy dźwięk, mówimy sposoby jego przechowy-
wania. Niestety, do tej pory nie ma takiego formatu plików audio, który stałby się stan-
dardem w sieci, tak jak to się stało z formatami GIF oraz JPEG w przypadku obrazów.
W użyciu jest wiele formatów, każdy z nich stosowany w innych przypadkach. W tym
rozdziale opiszemy pobieżnie najpopularniejsze formaty i zakres ich zastosowań.
[ Pobierz całość w formacie PDF ]