Ljudreflexer och dess olika varianter

 

Klangupplevelse och efterklang

Som en fortsättning på förra årets artikel ”Vad är efterklangstid?” i förra årets akustiknummer Nr 3 / 2010 vill vi nu gräva oss lite djupare i vad egentligen efterklangen består av. Efterklangen består ju av ett oändligt antal reflexer som avtar i nivå med tiden. Oftast betraktar man efterklangstiden som ett homoget energifält som gradvis tappar energi med tiden. Det är detta betraktelsesätt som ligger till grund för parametern ”efterklang”. Det gör ju att man har skapat sig en parameter som låter sig beskrivas och mätas på ett relativt enkelt sätt. Detta är enligt vår uppfattning den huvudsakliga anledningen till dess popularitet. Vi menar tyvärr att kopplingen mellan den akustiska upplevelsen och siffervärdena för parametern är tämligen låg.

Det finns naturligtvist en koppling att ett högt värde på efterklangstiden oftast, men inte alltid, innebär mer klang. För rum av likartad storlek skiljer sig dock efterklangstiden tämligen lite åt trots att de klangliga skillnaderna kan upplevas som mycket stora. Anledningen finns att finna i att klangen inte är ett homoget energifält utan består av enskilda reflexer med varierande nivå, täthet och tidsgap (tidslucka) sinsemellan. Även frekvensinnehåll, fasläge, riktning och interferens påverkar den klangliga upplevelsen. Det är nu viktigt att lite mer i detalj studera hur dessa reflexer skapas och påverkar oss.

 

Reflexers frekvens och egenskap

Till att börja med måste man förstå att reflexer i olika frekvensområden har olika utbredningsegenskaper. Låga frekvenser brukar man benämna frekvenser under 200 Hz och höga frekvenser från 2000 Hz och uppåt. Man kan också betrakta det som att låga frekvenser är frekvenser under rummets delningsfrekvens som ger en volymutbredning och att övriga frekvenser är frekvenser över rummets delningsfrekvens som ger en strålningsutbredning.

Med rummets delningsfrekvens menar man den frekvens där ljudutbredningen övergår från att vara en volymutbredning till en strålgångsutbredning. Med volymutbredning menar vi att ljudet inte har en bestämd riktning utan utbreder sig som en dimma och ger upphov till bland annat ett stående vågfält som också benämns ett reaktivt fält. Precis som i elläran är reaktiv energi ingen verklig energi och kan ge upphov till extremt höga amplituder. Strålgångsutbredning innebär att ljudet utbreder sig mer eller mindre som ljusstrålar och precis som med ljus kan man uppleva ljud mer eller mindre behagligt beroende på graden av diffusitet, riktning, mm.

Rummets delningsfrekvens är ingen knivskarp delning utan en gradvis övergång mellan de två olika utbredningsformerna som sträcker sig över några oktaver. Rummets delningsfrekvens bestäms av rummets dimensioner. I ett litet rum ligger delningsfrekvensen högt och i ett stort rum ligger delningsfrekvensen lågt. Delningsfrekvensen är 3x den frekvens som motsvarar rummets största dimension. Är rummets största dimension 3,4 m vilket är våglängden för 100 Hz så blir alltså delningsfrekvens i detta rum 300 Hz. Det betyder att det blir i huvudsak ett stående vågfält och interferenser som dominerar i frekvenser under 300 Hz och att strålgång dominerar över 300 Hz.

 

Stående vågor

Om vi börjar med att titta på vad som händer i frekvensområdet under delningsfrekvensen så kommer dessa frekvenser att skapa ett stående vågfält som består av resonanser för ett mycket stort antal frekvenser. Dessa resonanser uppstår när rummets dimensioner (längd, bred, höjd) eller multiplar av där överstämmer med våglängden hos en specifik frekvens. Dessa är de starkaste resonanserna och kallas axiella resonanser men man har även resonanser som är en kombination av samverkan mellan ytorna i ett helt plan eller rummets hela volym. Alla dessa kombinationsmöjligheter gör att ståendevågor kan inträffa vid 100-tals frekvenser.

Nivån på en stående våg bestäms av rummets dämpning eller absorption vid denna frekvens. Har vi ingen eller låg dämpning blir amplituden extremt hög. Man kan jämföra med en kyrkklocka. Den måste vara gjuten med en speciell klockmetall som har mycket liten inre dämpning. Den ringer väldigt starkt när den är rätt utförd men svagt med en felaktig metall som har en viss inre dämpning. Lägger man handen på en klocka, dämpas ljudet mycket kraftigt. Det är på samma sätt med en stående våg som med en rätt avstämd dämpning får amplituden att dämpas mycket kraftigt även om den faktiska ytan på den avstämda absorbenten är mycket liten. Man kan också bildligt betrakta det som att impedansen på en stående våg är mycket hög och att det är lätt att lasta ned eller kortsluta denna impedans.

Stående vågor ger ju upphov till en mycket kraftigt amplitudvariation i rummet så att man på en position kan ha en extrem hög nivå och i en närliggande position kan ha en utsläckning. Detta stående vågmönster påverkar i samma grad en lyssningsposition och en källposition. Det betyder att lyssnar man i en utsläckningsposition så hörs denna frekvens mycket svagt även om den kan vara starkt på andra platser i rummet. Om man placerar en högtalare i en utsläckningsposition så släcker högtalaren ut sig själv för denna frekvens i denna position och ljudnivån blir därmed svag i hela rummet för denna frekvens.

 

Interferens

Stående vågor förväxlas emellanåt med interferens. Stående vågor uppstår genom addition av ett oändligt antal reflexer i samma dimension och fas. En interferens kan uppstå genom att ingående och utgående ljudvågor samverkar eller motverkar varandra. Möts ingående och utgående ljudvåg i motfas så får man en utsläckning och om väggen inte har någon dämpning och möts de i fas får man en höjning med 6 dB. Det innebär att sitter man framför en hård vägg utan absorption och utsätts för ljud t.ex från en högtalare då ljudet studsar i denna vägg kommer man att få en mycket kraftig nivåvariation beroende på frekvens. Då uppstår det man kallar för en kamfiltereffekt där vissa frekvenser höjs med 6 dB och andra är mer eller mindre ohörbara.

Enda sättet att utjämna frekvensojämnheten är att kraftigt absorbera den reflekterande ytan för att på så sätt minska interferensen. Detta kan vara svårt att genomföra praktiskt i synnerhet vid låga frekvenser då det normalt krävs stora volymer för att absorbera låga frekvenser.

I studiosammanhang och andra tillämpningar där det krävs extremt bra taluppfattbarhet är just detta den stora utmaningen, att få kontroll på stående vågor och interferenser i låg frekvensområden. För att förstå skillnaden mellan stående vågfält som är reaktivt och interferens som är aktivt kan man jämföra en ringklocka med en högtalare. Ett finger på ringklockan får den tyst men inte högtalaren.

 

Strålgångsutbredning

För frekvenser med strålgångsutbredning över rumsutdelningsfrekvenser har man möjlighet att styra reflexernas riktning, tidsfördelning, täthet och frekvensinnehåll genom val av reflekterande material och dess placering. En vanlig stor slät hård yta fungerar så att en ingående reflex med en viss invinkel mot ytan reflekteras så att den utgående vågen har samma speglade utgående vinkel och har samma frekvens, fas och tidsinnehåll. Det fungerar helt enkelt som en våg i fritt fält bara att riktningen på vågen har förändrats. Detta kan användas för att rikta vågor mot ett håll där det ger mer nytta, exempelvis utomhusscener som oftast är formade som en snäcka eller nedsänkta vinklade undertak över en talarposition som gör att åhörarna får en förhöjd energi med bättre uppfattbarhet.

 

Reflektion, absorption, scattering och diffusion

Går man vidare kan man förändra egenskaperna hos den reflekterande ytan. Man kan förändra energiinnehållet för olika frekvenser genom att införa absorption för vissa frekvensområden. Man kan t.ex. sätta in lågfrekvensabsorbenter om man enbart vill höja energi för konsonanter och för att på så sätt ytterligare höja taluppfattbarheten.

Man kanske vill att reflexen skall sprida sig över en större vinkelarea för att på så sätt täcka in en större del av lyssnarskaran. Detta kan göras via något som kallas scattering. Det innebär att ljudet inte reflekteras ut i enbart en vinkel utan i stället täcker en vinkelsektor. Detta kan åstadkommas på många olika sätt. Man kan ha en större välvd konvex yta eller en yta som är sektionerad i olika vinkelsegment och på så sätt få många utgående vinklar. Man kan också använda sig av något som populärt kallas för diffusorer. Dessa senare är ofta uppbyggda i sektioner med olika djup, vilket kan innebära att ljudet, när det slår tillbaka ur diffusorn, interfererar med varandra och ger upphov till en bredare utstrålningsriktning.

Det är också så att en liten yta som avger ljud också ger en betydligt bredare utstrålning än en stor yta. Av den anledningen måste en diskanthögtalare vara liten för att få en bred utstrålning.

Det finns också diffusorer där praktiskt taget ingenting studsar tillbaka, utan allt slås istället ut åt sidorna. Ordet diffusor kan ha en viss missledande innebörd då vissa diffusorer är enbart avsedda för scattering och andra diffusorer enbart avsedda för just diffusion. Andra har en kombinerad effekt.

Diffusion innebär att en enskild reflex dras ut i tid. Det betyder att ett ljud som kanske bara är 1 ms långt kan bli upp till 5 ms långt med en mycket effektiv diffusor. Man kan ju undra varför det skulle vara en fördel att göra en reflex längre i tid. Det har med hjärnan att göra. Korta ljud har hjärnan svårt att hinna uppfatta eftersom hjärnan är mer än 1000 x långsammare än vad örat är. Av denna anledning kan man få hörselskador trotts att man tycker att ljudnivån är obetydlig. En vanlig knallpulverpistol låter inte särskilt mycket men ger trots allt en nivå på över 140 dB. I actionfilmer har man lärt sig detta och

 

Praktiska exempel

Diffusion och scattering är med andra ord viktiga akustiska redskap för att få en god och vältäckande uppfattbarhet. Som exempel kan vi nämna att vi var nere i Sala Silvergruva och lyssnade på både tal och musik och upplevde med viss förvåning att allt lät mycket bra trots totalt avsaknad av absorption men däremot med en extremt hög närvaro av diffusion och scattering tack vare det omgivande bergsrummets stora oregelbundenhet.

Vi har också vid ett tidigare tillfälle lyssnat på avancerad jazzmusik från Chick Corea på Palau de la Música Catalana i Barcelona. Denna hall har obefintligt absorption men maximal diffusion och scattering. Detta har åstadkommits med ett glastak där varje bit är vinklad och oregelbunden. Väggarna är täckta av skulpturer gjorda av mosaik. Trots alla hårda ytor ger lokalen en fantastisk musikupplevelse.

Ett annat exempel är den gamla reaktorhallen R1 på KTH i Stockholm. Den har en mycket lång efterklangstid på 7 sekunder och är mer eller mindre omöjlig att tala i om man står mitt ute i hallen. Där hölls nyligen ett föredrag av Jonas Forsell om opera. Föredraget skedde i den delen av hallen där takhöjden var bara ca 2,5 meter i stället för i mitten där takhöjden var ca 10 meter. Där fanns fortfarande inga absorbenter och efterklangstiden var den samma på 7 sekunder. Trots det var uppfattbarheten mycket god och det gick utmärkt att lyssna på olika operaexempel. På grund av kraftiga tidiga reflexer från tak och vissa väggar så försvann problemet med den långa efterklangstiden.

Vi har också i studiesyfte besökt en stor mängd olika kyrkor som har det gemensamt att de har en mycket lång efterklangstid. Likväl kan man konstatera att dessa kan skilja sig klangmässigt i mycket hög grad. Våra protestantiska kyrkor i Sverige har ofta låg utsmyckningsgrad med stora släta ytor medan andra kyrkor som tex katolska kyrkor har hög utsmyckningsgrad och därmed högre diffuserande egenskaper. Hörbarheten i dessa senare är oftast betydligt högre.

 

Diffusion

En diffusor är ju ett helt hårt föremål utan absorption. Mäter man med traditionella Sabinska metoden på en diffusor visar denna dock att man rent matematiskt får en absorption ofta i storleksordningen α = 0,3. Det föreligger dock en skillnad vid reflex mot en plan yta där allt ljud reflekteras tillbaks med samma fasläge. På en diffuserande yta kommer ljudet att till stor del reflekteras med en randomiserad fasläge vilket innebär att faslägena på de enskilda komponenterna i reflexen är slumpmässiga och vi får en effektmässig addition vilket gör att amplituden på reflexen minskar med 3 dB. Har ytan dessutom en scateringeffekt minskar nivån naturligtvist i motsvarande grad som energin fördelar sig vinkelmässigt.

 

Hörbarhet

Hur ser då en god hörbarhet ut rent tekniskt?

Frekvensmässigt skall de låga frekvenserna hållas ned i nivå för att ge en minskad maskeringseffekt. I synnerhet skall stående vågor dämpas då det kan ge avsevärd maskeringseffekt. Konsonantljud skall energimässigt ligga lite högre i nivå än övriga ljud.

Reflexer som ligger mycket nära i tid alltså inom några få (2-3) millisekunder skall undvikas då det kan interferera med direktljudet och släcka ut stora frekvensområden. Därefter skall följande reflexer ligga ned i nivå olika mycket beroende på tillämpning. Ju mer akustiskt stöd man önskar desto högre nivå ska reflexerna ha men aldrig högre än direktljudet på de enskilda reflexerna. Det är detta som kallas för akustiskt stöd och för en kör eller orgel eller talare skall detta stöd vara påtagligt vilket innebär att reflexerna ska ligga ner i nivå några dB.

I kontrollrumsammanhang där man vill ha en opåverkad lyssning från högtalarna skall alla dessa reflexer ligga ned i storleksordning 20 dB relativt direkt ljudet. Här gäller också att dessa tidiga reflexer inte bör komma före 20 ms.

I samtliga fall är det en fördel att undvika starka diskreta reflexer utan dessa bör ha stor täthet med lägre amplitud.

Slutligen är det också viktigt med infallsinriktningen på reflexerna relativt örat. För högre frekvenser skiljer sig örats nivå-känslighet för olika riktningar mer än 20 dB vilket betyder en faktor 100. Vi har relativt låg känslighet för ljud som kommer bakifrån och uppifrån medan ljud som kommer framifrån och i synnerhet från sidorna har hög känslighet. Högst känslighet har örat för ljud som faller in från sidan lite snett framifrån och med en viss liten förhöjning i vinkel. Det betyder att en reflex som når oss från denna position har en avsevärd större påverkan än en reflex som kommer uppifrån eller bakifrån.

 

Sammanfattning

Sammantaget gör detta att vår upplevelse av klang, uppfattbarhet och välbehag inte kan låta sig summeras av en nästan oförskämt enkel siffra som efterklang. Man kan säga att efterklangstid är en mycket trubbig parameter för att ange en klangupplevelse dels pga att bara är en siffra som varierar mycket lite mellan olika rum av jämförbar storlek och dels för att det inte låter sig påverkas av en mängd andra viktiga akustiska faktorer.

Visa ljud ger en maskering medan andra ger en förstärkt tydlighet. Visa tidsintervall är positiva och andra är negativa. Ljudets infallsriktning har en stor betydelse och många andra variabler påverkar vår upplevelse av ljudet.

Efterklangstiden påverkas obetydligt eller inte alls även om man har kraftiga förändringar av ovan nämnda variabler. Att enbart specificera en efterklangstid ger med andra ord ett helt slumpmässigt klangligt resultat. Vi efterlyser i Standarden lite mer framträdande anvisningar och rekommendationer för klangbehandlig.