Jak tworzyć dobry podcast?

Tworzenie wartościowego podcastu wymaga odpowiedniego planowania, zaangażowania i pracy. Omówimy kroki, które pomogą Ci stworzyć podcast, który będzie przyciągał słuchaczy i wyróżniał się na rynku.

A co to właściwie jest podcast?

Podcast jest czymś w rodzaju słuchowiska lub filmików publikowanych w Internecie w odcinkach. Może mieć formę osobistych przemyśleń, kursów, poradników, czytanej przez lektora historii. Jest on generalnie nagraniem tego czym twórca chce się podzielić ze słuchaczami lub widzami i staje się on coraz bardziej wśród nich popularny. Można nagrywać go solo, można nadać mu formę wywiadu. Jeżeli nagrywa się podcast w postaci wideo, można z niego wydobyć ścieżkę dźwiękową, powycinać fragmenty z zająknięciami, „yyyyy”, „mmmmm”, lapsusami językowymi i opublikować ją jako podcast audio. Ogromną zaletą tego rodzaju podcastu jest dla słuchacza to, że nie trzeba na nim skupiać uwagi tak jak na nagraniu wideo, gdyż można go słuchać robiąc różne rzeczy, np. jadąc samochodem, czy uprawiając sport; dla twórcy natomiast zaleta jest taka, że tworz on silniejszą więź z odbiorcą swoich treści niż poprzez słowo pisane, np. na blogu oraz stres mniejszy niż podczas nagrania filmu.
Forma publikacji podcastu bywa różna. Podcast może być streamowany, czyli udostępniany online lub do pobrania na komputer, telefon i słuchany, bądź oglądany offline. Udostępnić można na YouTube, Spotify, Google Podcasts, Apple Podcasts lub na blogu, czy własnej stronie WWW.

Co daje nagrywanie podcastów?

Podcast pomaga w budowaniu własnej marki. Markę buduje się w pierwszej kolejności dając się poznać, a podcast jest jedną z metod. Następnie słuchacz, widz, klient musi Cię polubić, a potem zaufać. Jeżeli Cię słucha lub ogląda regularnie, to czuje jakbyście się znali, a jeżeli korzysta z Twojej wiedzy, to już stajesz się jego autorytetem.

Nagrywanie podcastu
Ponieważ zajmuję się obróbką dźwięku, opiszę wyłącznie tworzenie podcastu audio.

Jak i od czego zacząć nagrywanie podcastu?

Warunki nagraniowe

W pierwszej kolejności należy zadbać o warunki nagraniowe. Nawet na profesjonalnym sprzęcie z wysokiej półki cenowej nagranie będzie kiepskie, jeśli kiepskie będą te warunki i nie ma co oczekiwać cudów, że podczas obróbki się je poprawi znacząco. Jeśli ktoś ma studio nagraniowe, to nie ma o czym mówić, ale przeciętny twórca podcastów mieć go raczej nie będzie, ale to nie tragedia. Zakładam, że nagrywamy w swoim pokoju, bo tak będzie w większości sytuacji. Przy nagraniu należy zadbać o to, aby jak najbardziej zminimalizować pogłos pomieszczenia. Nie nagrywamy więc w pustym pomieszczeniu z gołymi ścianami. Raczej nie posiadamy mieszkania bez mebli – i bardzo dobrze. Super jak pod miejscem siedzenia mamy dość gruby dywan, a za plecami np. kanapa. Elementy te pochłaniają w pewny stopniu dźwięki (im miększy i grubszy materiał, tym lepiej), wnęki w meblach – jeśli są – będą natomiast rozpraszać dźwięki i też osłabiać pogłos. Świetnym pomysłem jest też mówienie do otwartej szafy wypełnionej ubraniami, bo one są po prostu miękkie.

Mikrofon

Mikrofon pojemnościowy
Kolejna rzecz, to mikrofon. Ja polecam pojemnościowy lub elektretowy, ponieważ są bardzo czułe (uwaga na tykanie zegara, czy odgłosy z ulicy!) i rejestrują wszelkie subtelności naszego głosu przez co zabrzmi on żywiej. Elektretowe są najczęściej mikrofony do komputera lub te w telefonie i zazwyczaj są gorszej jakości niż pojemnościowe, ale są też takie, których jakość jest znakomita, ale cena też odpowiednio wysoka. Jaka powinna być w ich przypadku optymalna odległość od ust? Ja układam dłoń w gest „call me”, kciuk wtedy przystawiam do ust, a koniuszek małego palca do kopuły mikrofonu. Ważne, żeby nie mieć mikrofonu zbyt blisko ust, bo głos staje się przebasowiony (tzw. efekt zbliżeniowy), a jak jest zbyt daleko, to zbiera więcej pomieszczenia, tzn. naszego odbitego głosu od ścian, mebli itd. i głos jest nie tylko oddalony, ale jest więcej pogłosu, którego przecież chcemy się pozbyć.
Mikrofon pojemnościowy musi być zasilany napięciem phantom (zazwyczaj +48 V), więc interfejs audio (o tym poniżej) musi dawać taką możliwość. Są też mikrofony z wbudowanym interfejsem lub z możliwością zasilania z baterii czy też z wbudowanym akumulatorkiem, które ładuje się tak jak telefon. Jeśli interfejs nie ma możliwości zasilania takich mikrofonów, a nasz mikrofon nie posiada gniazda baterii lub wbudowanego akumulatora, to pozostaje zastosowanie przedwzmacniacza mikrofonowego, który dostarczy odpowiedniego zasilania lub prosty mikser z wejściem mikrofonowym, który ma wbudowany przedwzmacniacz.
Przykładowe mikrofony pojemnościowe dla podcasterów, to mogą być Novox NC-1, Samson C03U USB, Rode M3 lub (z wysokiej półki) Blue Yeti Pro. Polecam tu także rejestratory (o nich poniżej), chociażby Tascam DR-05 (z mikrofonami elektretowymi) lub Tascam DR-40x (z interfejsem audio).

Mikrofon dynamiczny
Mikrofon dynamiczny nie jest tak czuły jak pojemnościowy i jego zaleta jest taka, że jeśli w pomieszczeniu, w którym nagrywamy słychać ciche dźwięki otoczenia, to istnieje duża szansa, że się nie nagrają, ale nasz głos nie będzie tak żywy. Nie wpłynie to negatywnie na jakość nagrania, ale głos z pojemnościowego słucha się po prostu przyjemniej. Mikrofony dynamiczne są też tańsze od tych drugich. Ponieważ te mikrofony nie są tak czułe, to odległość od ust powinna być mniejsza, tak na 3-4 palce. Oczywiście za mała też nie powinna być ze względu na wspomniany wcześniej efekt zbliżeniowy.
Mikrofony dynamiczne nie potrzebują dodatkowego zasilania i można je podłączyć np. do wejścia mikrofonowego komputera, ewentualnie poprzez odpowiednią przejściówkę ze złącza XLR do minijacka.
Przykładem takich mikrofonów może być Behringer XM8500, legendarny już Shure SM58 lub Rode Podcaster.
Przed mikrofonem (niezależnie od typu) dobrze jest też umieścić pop filtr, który przygasi głoski wybuchowe takie jak „p” i „b”, które bez filtru są nieprzyjemne w odsłuchu, gdyż cechują się nagłym wzrostem ciśnienia dobiegającego do naszych uszu, a nawet przy zbyt wysokim poziomie głośności podczas nagrywania, mogą powodować przesterowania.
Dodam jeszcze, że nic nie stoi na przeszkodzie, żeby nagrywać telefonem czy mikrofonem wbudowanym w laptop. Wszystko zależy od tego jakim dysponujemy budżetem, czy w ogóle chcemy inwestować w sprzęt i czy jakość tego co już mamy nie jest dla nas satysfakcjonująca.

Urządzenie rejestrujące

Karta muzyczna w komputerze
Najprostszym urządzeniem rejestrującym dostępnym w każdym w zasadzie komputerze jest karta muzyczna. Jej zaleta jest taka, że… jest i nie trzeba wydawać dodatkowych pieniędzy na interfejs audio czy rejestrator (o tym poniżej). Podłącza się do niej specjalne mikrofony komputerowe (elektretowe) z wyjściem mini-jack, ale możemy też podłączyć mikrofon dynamiczny z wyjściem XLR (typowe złącze do przenoszenia sygnałów mikrofonowych), jeśli zaopatrzymy się przejściówkę XLR – mini-jack. Nie ma jednak możliwości podłączenia mikrofonu pojemnościowego, ponieważ karty te nie mają możliwości zasilania napięciem phantomowym, chyba że dysponujemy przedwzmacniaczem mikrofonowym lub prostym mikserem audio, który ma wbudowany taki przedwzmacniacz.

Interfejs audio
Interfejs audio jest taką zewnętrzną kartą dźwiękową o znacznie lepszej jakości niż wewnętrzna karta w komputerze. W zasadzie zdecydowaną większość interfejsów podłącza się do komputera za pomocą kabla USB. Pozwala nagrywać za pomocą mikrofonu dynamicznego, a jeśli posiada zasilanie phantom, to także i pojemnościowego. Ponadto daje możliwość nagrywania z wyjścia liniowego innych źródeł dźwięku (np. odtwarzacza audio, keyboardu), a także nagrywania gitary elektrycznej, jeśli mają wejście wysokoimpedancyjne Hi-Z. Jeśli to nie jest najtańszy interfejs to możemy nie tylko odsłuchiwać w podłączonych do niego słuchawkach dźwięk, ale również na zewnętrznych monitorach (specjalnych głośnikach odsłuchowych).
Przykładowe interfejsy to bardzo prosty ESI UGM96, Behringer Xenyx 302USB – to jest akurat mały mikser audio z interfejsem, Behringer U-PHORIA UMC202HD, czy Focusrite Scarlett Solo Studio 3rd Gen – to już cały zestaw do nagrywania wraz z mikrofonem i słuchawkami nausznymi.
Są też mikrofony z wbudowanym interfejsem. To są wszystkie te, które posiadają złącze USB. Jest to np. wymieniony wcześniej Novox NC-1 lub Samson C03U USB.

Cyfrowy rejestrator audio
Rejestrator audio to nic innego jak taki dyktafon. Pozwala nagrywać dźwięk bez komputera, a nawet i bez mikrofonu, ale jeśli rejestrator nagrywa w stereo, to lepszy będzie taki, który umożliwia ustawienia mikrofonów w konfiguracji X-Y, żeby zbierały dźwięki z ust, a nie bardziej z otoczenia. Są rejestratory wyposażone w wejścia XLR/TRS do podpięcia zewnętrznych mikrofonów, które mogą zasilać napięciem phantomowym, dzięki czemu stają się takim bardzo poręcznym mobilnym „studiem nagrań”. Są też nawet takie, które posiadają wbudowany interfejs audio dzięki czemu można go podłączyć do komputera i na nim nagrywać.
Przykładowymi rejestratorami są Tascam DR-05, Tascam DR-40x (z wbudowanym interfejsem audio), Zoom H1n.

Oprogramowanie

Do nagrywania, a już tym bardziej obróbki nagrań potrzebne jest oprogramowanie. Niepolecam używania oprogramowania wbudowanego w system operacyjny, ponieważ on pozwala jedynie nagrać dźwięk i tyle. Jest ono z reguły zbyt proste i robienie czegokolwiek ze ścieżką będzie bardzo uciążliwe, jeśli nie niewykonalne. Jest sporo darmowego oprogramowania do ściągnięcia i ja polecam program Audacity, na którym sam pracuję. Jest nie tylko darmowe, ale i międzyplatformowe, więc można z niego korzystać na Linuksie, w Windows, czy MacOS. Uważam, że do nagrywania i obróbki podcastów w zupełności wystarczy. Inne programy darmowe to np. Free Audio Editor (dla Windows i MacOS) czy Wavepad (Windows, MacOS, smartphone’a, a nawet Kindle). Jeśli ktoś wybiera oprogramowanie płatne, to godnymi polecania są: prosty Ringr, bardziej zaawansowane Pro Tools Podcast czy Logic Pro Podcast lub taki „kombajn” jak Adobe Audition czy dowolny program stosowany w studio nagrań.

Jak nagrywać?

Przed nagraniem zrób próbę, żeby ustawić głośność tak, aby nie zbliżyć się do poziomu 0 dB, a najlepiej zostawić sobie przynajmniej 6 dB zapasu, żeby dźwięk nie był przesterowany podczas nagrywań i dalszej obróbki, np. gdy podbijamy jakieś częstotliwości. Proponuję zapas, ponieważ nie mówimy zawsze z tą samą głośnością – czasem będzie głośniej. Pamiętaj o właściwej odległości ust od mikrofonu. Nagrywaj w mono – w końcu źródło dźwięku, czyli Twoje narządy mowy, jest jedno i skupione w małej przestrzeni. Zaoszczędzi to miejsca na dysku i czasu podczas późniejszej obróbki (o tym poniżej). Częstotliwość próbkowania 44,1 kHz w zupełności wystarczy, ale jeśli masz lepszy sprzęt nagrywający (mikrofon, interfejs audio) to proponuję 48 kHz – na takiej częstotliwości standardowo pracują karty dźwiękowe, więc nie będą musiały dodawać próbek, których w sygnale nie ma, gdy nagrywamy z niższą częstotliwością, żeby „uzupełnić” do tych 48 kHz, a poza tym szkoda nie wykorzystać takiego sprzętu w pełni. Jeśli nagrywamy na rejestratorze, to format MP3 wystarczy, ale jeśli chcemy mieć lepszą jakość, to proponuję wybrać jednak format bezstratny WAV, zwłaszcza, że potem nagranie będzie obrabiane, więc lepiej to robić na nienaruszonym żadną kompresją dźwięku. Oczywiście nie musisz zastosować tych dwóch zasad. Możesz nagrać dźwięk z częstotliwością 44,1 kHz w formacie MP3 i w 48 kHz w formacie WAV i porównać. Jeśli jesteś zadowolony/-a z opcji pierwszej to wybierz ją – zaoszczędzisz miejsce na dysku.

Jak mówić, żeby chciano nas słuchać?

To, że trzeba mówić wyraźnie, to oczywistość. Raczej mało kto jest aktorem i nie ma tak pięknej dykcji jak oni, więc lapsusy językowe, zająknięcia, chwile zastanowień będą się zdarzały, ale rzecz w tym, że trzeba umieć nad tym panować. Jeśli zorientujesz się, że powiedziałeś coś niewyraźnie lub zacząłeś mówić o czymś o czym nie chciałeś, bo trochę popłynąłeś, to zrób krótką pauzę i powtórz słowo lub całe zdanie. To bardzo ułatwia późniejszą obróbkę. Może pojawić się też taka sytuacja, że po nagraniu przyszło ci coś do głowy, to nagraj to w podobnych warunkach (to samo miejsce, ta sama odległość mikrofonu od ust, te same ustawienia parametrów nagrywania), a potem się to doklei. W trakcie całego nagrania staraj się nie zmieniać pozycji, odległości ust od mikrofonu, bo takie rzeczy są słyszalne. I po nagraniu dobrze przesłuchaj nagranie i zastanów się co możesz zmienić w swoim sposobie mówienia, żeby było lepiej i co bardzo ważne – zapytaj też innych jak to odbierają, bo w końcu nagrywasz dla kogoś i słuchacz nie powinien czuć dyskomfortu słuchając ciebie.

Obróbka nagrania
Ta część przeznaczona jest dla tych, którzy sami będą obrabiać swoje podcasty. Nie musisz tego robić, jeśli nie chcesz lub nie masz czasu i zlecić to mi lub komukolwiek, kto się tym zajmuje. Obróbka trwa rzecz jasna dłużej niż samo nagranie – jak bardzo, to zależy jak płynnie mówisz – bo nie tylko musisz przesłuchać nagranie słowo po słowie i potem dokonać korekt częstotliwości i głośności, ale także powycinać co zbędne (lub też ewentualnie coś dokleić).

Wycinanie tego co niepożądane

Jeśli nie jesteś jednak aktorem, to najprawdopodobniej będziesz musiał coś wyciąć. Będą to takie chwile zastanowienia: „yyyy”, „mmmm”, zająknięcia, mlaśnięcia, pomylone słowa i zdania. Ja osobiście przytłumiam także głoskę „k”, bo jest mocno wybuchowa i tak gryzie w ucho. Staram się też zniwelować trzaski na ile to możliwe, które się pojawiają, gdy nagle dźwięk wyskoczy na chwilkę powyżej 0 dB. Dobrze jest przytłumić trochę momenty, w których bierzesz oddech, ale tylko jeśli jest on zbyt wyraźny. Nie usuwaj ich jednak, żebyś nie brzmiał jak martwy robot. Wytnij lub ścisz maksymalnie dźwięki tła, jeśli słychać je w pauzach.
Nawet jeśli nie chcesz tracić czasu na obróbkę i całą robotę zlecisz komuś, to warto przynajmniej powycinać niepotrzebne słowa lub dźwięki i ewentualnie dokleić, co dograłeś później, bo sam wiesz najlepiej co chciałeś przekazać. Gdy ten etap jest zakończony, można przejść do kolejnego, bardziej zaawansowanego.

Co zrobić, żeby nagranie brzmiało jeszcze lepiej?

Usuwanie szumu i wycięcie najniższych częstotliwości
Czy wpierw zaczynamy o wycięcia szumów, czy wycięcia najniższych częstotliwości nie ma specjalnego znaczenia. Szumy wycinamy tyle ile to konieczne. Jeśli za mało, to są zbyt słyszalne, jeśli za dużo to „psują” nasz głos (ja bym powiedział, że słychać wtedy takie syknięcia w głosie). Niskie częstotliwości natomiast wycinamy tak od 50 Hz do 100 Hz, żeby wyciąć ewentualne tętnienia napięcia sieciowego oraz szumy powietrza. Dźwięk dzięki temu staje się też mniej „zamulony” (przesycony niskimi częstotliwościami).

Korekcja częstotliwości

Wycinanie pojedynczych częstotliwości
Wycinamy może nie poszczególne częstotliwości, ale bardzo wąskie ich przedziały, takie „szpileczki” ustawiając dostatecznie dużą dobroć filtra (oznaczaną jako Q). Możemy wtedy wyciąć dużo – z 10 dB i więcej, ale to już trzeba wziąć na słuch. Ja staram się jednak nie przekraczać 10 dB.
Między 100 Hz a 200 Hz wycinam rezonanse i dudnienia wynikające z małych rozmiarów pomieszczenia. Jeśli nagrywamy w swoim pokoju lub dowolnym pomieszczeniu w mieszkaniu, to zazwyczaj jest ono małe. Dźwięk dzięki temu staje się słyszalnie „lżejszy”. Jeżeli ktoś mówi nosowo, to wycinam w przedziale 300-600 Hz. Ważny jest jeszcze de-eser, ale to poniżej.

Podbijanie częstotliwości
Podbijamy o mniej dB niż wycinamy, bo podbicia mają być jak dobry makijaż u ślicznej kobiety – ma podkreślać jej urodę, a nie czynić ją piękniejszą niż jest, bo można łatwo przesadzić. Zwłaszcza, że wybieramy mniejszą dobroć filtra, więc podbijamy szerszy zakres częstotliwości, więc zmiany będą wyraźniejsze.
Wzmacniam częstotliwości o 2-4 dB między 9 a 11 kHz, żeby głos stał się bardziej klarowny, i jeszcze podbijam w zakresie 12-16 kHz o podobną wartość, ażeby nabrał jakby więcej przestrzeni. (Co oznaczają te magiczne słowa: „klarowny” i „więcej przestrzeni”? To już trzeba samemu sprawdzić na własne uszy 🙂 )

Kompresja

Kompresja dźwięku służy do wyrównywania głośności głośniejszych fragmentów z tymi cichszymi. W kompresorze ustawia się głównie:

czas ataku, czyli czas trwania dźwięku powyżej ustalonego progu, po którym następuje aktywacja kompresora,

czas trwania kompresji (wyzwalania) po tej aktywacji,

próg zadziałania,

stopień kompresji, czyli jak bardzo szczyty dźwięku zostaną zmniejszone.
Czas ataku ustalam między 2 a 5 ms, a czas wyzwalania między 130 a 180 ms. Próg zadziałania wybieram wizualnie patrząc jaka jest średnia amplituda dźwięku na przebiegu (wykresie dźwięku). Stopień kompresji w zasadzie wybieram zawsze 1:8, bo w podcaście, czy audycji nie chodzi o jakieś subtelności w głośności – wszystko powinno być równie słyszalne.

Przytłumianie głosek syczących
A co zrobić z irytująco syczącym „s” i „sz”? Tutaj potrzebne jest narzędzie, które jest takim kompresorem działającym na określonym przedziale częstotliwości, mianowicie de-eser. Tutaj też ustalam próg zadziałania patrząc na poziom głośności takiej syczącej głoski wybierając średnią ze wszystkich, czułość de-esera oraz ów przedział częstotliwości, który także wybieram na podstawie tej głoski, ale już nie przebiegu, tylko jej widma – zazwyczaj między 6 a 9 kHz.

Pogłos
Jeśli głos jest w stereo, to można dodać leciutki pogłos, żeby nadać więcej przestrzeni, ale nie trzeba. Co komu lepiej będzie pasowało, ale lepiej nie dodać niż przesadzić.

Normalizacja poziomu / normalizacja głośności
Normalizujemy poziom najwyższego szczytu do 0 dB lub lepiej odrobinę poniżej, np. 0,1 dB. Od pewnego czasu (konkretnie od 2010 r.) dokonuje się normalizacji głośności, czyli poziomu średniej głośności LUFS całego materiału dźwiękowego, a nie najwyższego szczytu. Dzięki temu, jeśli puszczane pomiędzy sobą nagrania mają ten sam poziom LUFS, wszystkie są słyszalne na tym samym poziomie. Przyjętym – za Apple Podcasts – standardem jest -16 LUFS.

Etap końcowy

Gdy już wykonaliśmy wszystkie powyższe kroki można już przygotować nagranie do publikacji. Jeśli mamy jakieś intro i/lub outro i/lub jeszcze muzyczkę w tle, to teraz jest odpowiedni moment, żeby je umieścić w nagraniu odpowiednio dostosowując głośność może nawet ściszając lub zgłaśniając w momencie wejścia nagrania lub jego zakończenia. Jeśli to zostało wykonane, to teraz trzeba wyeksportować całość do pliku, który zostanie opublikowany. Raczej zawsze jest on kompresowany stratnie, więc można go wyeksportować do formatu np. MP3, OGG, WMA, czy AAC. Proponuję z najlepszą jakością. One i tak są znacznie mniejsze niż WAV, więc po co tracić za dużo na jakości, zwłaszcza, gdy nagrywaliśmy sprzętem z wyższej półki. Proponuję też pozostawić tę samą częstotliwość z jaką nagrywaliśmy, chyba że jest wyższa niż 48 kHz, to obniżyć do tej częstotliwości. Teraz to już pozostaje tylko umieścić nasz podcast na własnej stronie, na Google Podcasts, Apple Podcasts, Spotify, YouTube czy gdziekolwiek indziej.

Telefon

696 675 050

Śledź nas na

Copyright © 2023 ANUEL AUDIO