Har lite dötid så jag tänka skriva ihop en liten post om hur människan uppfattar ljud och i sin tur hur det påverkar inställningarna av ljudstyrka och tidsskillnad (gain/tidskomp). Detta för att förstå vad som egentligen händer när vi justerar inställningarna i våra ljudanläggningar. Kommer även ta upp begrepp som fas och hur diffraktion/reflektioner påverkar ljudbilden.
Vi börjar med vår hörsel. Dels hur hjärnan behandlar informationen som hjälper oss att lokalisera ursprunget av ett ljud och dels örats känslighet för fas och frekvenssvar. Örat skiljer sig en hel del från en mikrofons funktion som exempel. Vårt hörselsinne är inte linjärt, tvärtom varierar örats känslighet kraftigt mot olika frekvenser. Redan på slutet av 30-talet gjordes experiment inom isofoni (vårt intryck av ljudnivå vid olika frekvenser) av ett par gubbar som hette H. Fletcher och W. Munson, diagrammet som beskriver sambandet mellan volym/frekvens kallas därför Fletcher-Munson kurvan. Bild på detta kan ses nedan.
Som ni ser är örat exceptionellt känsligt vid frekvenser runt 2000-4000Hz och tappar känslighet över 10Khz. Hela basområdet har riktigt dålig känslighet vid lägre volymer men skillnaden jämnar ut sig desto högre den relativa volymen är. Från detta diagram kan man dra slutsatsen att runt 2-4Khz är vi väldigt känsliga för höga ljudtryck, detta förklarar hur vi tycker ljud kan vara "skärande" och det finns toppar i frekvensåtergivningen runt dessa frekvenser. Det förklarar även varför vi ofta vill ha lite extra tryck i basområdet. Man får tänka på att vi uppfattar en effektfördubbling/halvering vid ca 9-10dB och en akustisk fördubbling/halvering är 3dB, dvs vad en förstärkare "ser" som en effektfördubbling/halvering. Nu när vi vet hur vi uppfattar frekvens vs ljudnivå så kan vi gå in på hur vi lokaliserar ljud.
Detta är intressesant i högsta grad för det har att göra med hur man ställer in tidskomp och gain. För att göra en komplett en komplett tidskomp krävs mätinstrument p.g.a hörselsinnets begränsningar. Vårt hörselsinne kan med stor precision bestämma riktningen från olika källpunkter MEN med en viktig omständighet som begränsar våra möjligheter att ställa in tidskompen fullt ut. Denna begränsning är frekvensberoende, under ca 800Hz lokaliserar vi ljud via tidsskillnader mellan olika punkter. Över ca 800Hz avtar vår förmåga att lokalisera via tidsskillnader och istället tar förmågan att lokalisera via ljudvolym över! Vid ca 1600Hz blir volymen från olika källor dominant och tidskompet blir otroligt svårt att ställa in med hjälp av hörseln. Mellan dessa frekvenser (800-1600Hz) finns en slags gråzon där en blandning av båda sätten bestämmer lokalisering. Man får alltså känslan av att ljudkällans avstånd förändras när i själva verket endast dess intensitet förändras. Sammanfattningsvis kan man alltså tidskompa med öronen upp till ca 1,6Khz. Men det börjar bli svårt redan runt 800Hz att göra detta. Efter ca 1,6KHz får man nivåjustera sig fram tills man får en bra balanserad ljudscén. Så varför behöver man tidskompa efter denna gräns när det ändå inte har någon stor betydelse på våran ljudscén? Det är här vi kommer till begreppet fas. När vi tidskompar ställer vi själva verket in fasen mellan elementen och fasen spelar roll även efter vi tappar förmågan att riktningsbestämma med hjälp av den.
Runt delningsfrekvensen mellan högtalarelementen kan fasfel uppstå, detta är välkänt. Det som menas är att det finns en tidsskillnad mellan de olika elementens reproducerade ljud. Fasen kan liknas med en vattendamm. Släpper du en sten i dammen kommer vågor produceras och avta desto länge från källan de kommer. Tänk er vågornas höjd som ljudvolymen och avståndet mellan dom som frekvensen. När vi introducerar fas till vår liknelse måste vi ha två stenar som faller i dammen, ganska meningslöst annars. Tänk er nu två stycken stenar som ramlar ner i dammen från två olika sidor. Vågor kommer uppstå från båda hållen men vad händer när de möts? Här kommer det uppstå rippel i vågen. En del vågor neutraliseras medan andra förstärks, detta p.g.a att vågorna möts inte samtidigt. Fasen är inkorrekt. Om vi kan få vågorna att mötas på ett sådant sätt det skapas minimalt med rippel, minimalt med höga vågor och neutraliseringar kommer vi få vågor som samarbetar till att skapa ett harmoniskt system. Ett faskorrekt system. Detta kommer påverka frekvenssvaret (tätheten mellan vågorna) i form av rippel och resulterar i hörbart ljud. Vid högre frekvenser än 1,6KHz är vårt hörselsinne dåligt på att korrigera de tidsskillnader som orsakar ripplet i form av fasfel mellan elementen. Därför krävs mätutrustning om man inte vill sitta i evigheter och prova sig fram. En sak jag märkt är att instrument som reproducerar toner från ca 1Khz och uppåt kan man justera "djupet" på med en bra EQ. Genom att justera intensiteten vid olika frekvenser kan man få det att låta som ett instrument är längre ifrån eller närmare lyssningspositionen. Här gäller det att experimentera sig fram. Som vi nu vet angående vår hörsel, är återgivna frekvenser över ca 1,5-1,6Khz både känsliga för örat och lokaliseringsbestämmande. Detta ställer höga krav på det element som ska återge dessa frekvenser, samt dess montering. Ofta sköts dessa frekvenser av en midbas upp till 3-5Khz (generellt...), därefter brukar en diskant ta vid och återge frekvenser uppåt 20Khz. Det är nu vi kommer fram till diffraktion som har uteslutande med montering att göra. Jag hävdar med följande information att det kommer låta bättre att låta en diskant gå så lågt som möjligt (gärna 1500-1600Hz delning), kräver dock en diskant av bra kvalitet med riktigt lågt Fs (friluftsresonans). Anledning: Montering avsedd för kontrollering av diffraktion. Med ett bra element och skarp delning (18/24db/okt) tror jag i de flesta fall att det kommer bli en klar förbättring, det kommer bli ökad distorsion från elementet men att kontrollera diffraktionen väger tyngre.
Diffraktion är fenomen som är orsak till fler problem än vad många tror. På Linkwitz-Labs hemsida har tagit upp problemet men i mitt tycke underskattar Linkwitz dess betydelse. Diffraktion har både betydelse inom optik och inom ljud. Inom ljud kan de förstöra scénbilden, ge upphov till rippel i frekvenssvar och ge onaturligt och hårt ljud. Diffraktionen står i proportion till frekvensen som ska återges, då det handlar om våglängden. Desto längre våglängd, desto svårare att göra något åt diffraktionen för det blir till slut så långa våglängder att det är fysiskt ohanterbart i en bil. Detta fenomen handlar om att få bort tidiga reflektioner. Hårda kanter nära elementet är ofta en bov. Även plana ytor, montering nära rutor ger diffraktion. Det finns flera sätt att eliminera diffraktionen, det finns ett sätt som är smidigt dock. Till att börja med bör detta tillämpas på diskanter men det kan ha viss effekt på mellanregister beroende på hur höga frekvenser de återger. Det man gör är att man sprider ut reflektionen i tid och frekvens genom diffusion. Låter komplicerat? Det är faktiskt riktigt enkelt, bygg en låda till diskanterna som är formade som ett ägg eller boll. Det reflekterade ljudet kommer spridas runt "ägget" och sönderdelas över flera oktaver och över flera millisekunder tid och ripplet kommer minimeras. Direktljudet från högtalaren blir dominant och scénen kommer förbättras avsevärd. BoW har med sin high-end Nautilius högtalare förstått detta problem och byggt en låda utan hårda kanter som minimerar diffraktionen. Köp ett runt klot, dela det på mitten och placera elementet likt denna (ska vara i kanten, jäms med halvklotet):
Formeln är följande: 34290/nedre frekvens du vill kontrollera diffraktion/pi = Diameter på halvklotet. Dvs 34290/1000Hz (ex)/3,14 = 10,9cm diameter. Diffraktionen kommer kontrolleras ner till 1000Hz med 10,9cm halvklot.
Exempel på diffraktion:
Läs gärna hela tråden på diyma (Creds går till Patrick Bateman, trådskaparen): Soundstage/Diffraction
Sen lite om reflektioner, dessa brukar inte vara ett problem utan ger en känsla av rymd. Det viktiga är att reflektionerna dämpas och sker ett tag efter originalkällan reproducerar ljudet. Tidiga reflektioner måste antingen dämpas, absorberas eller bäst elimineras med hjälp av diffusion. Detta är mycket viktigt för en trevlig scén i bilen. Jag förespråkar mätning av allt tidsrelaterat och tonala skillnader mellan sidorna. Via mätning kan man se både tidiga reflektioner, sena reflektioner, fas mellan elementen och fas mellan sidorna. Man kan mäta distorsion och tonala problem mellan sidorna som kan ge upphov till inkorrekt scénbild. Men utan kunskap av vad man bör göra med datan man får av programmen och hur man ska tillämpa dom är man förmodligen bättre ute om man justerar med hörslen. Kan förstöra mer än vad man fixar. Eliminerar man problem med fas, diffraktion och tonala skillnader mellan sidorna kan man få mycket naturligt och bra scén i bilen. Det viktiga som jag märkt är att det är inte det totala frekvenssvaret som spelar den största rollen, utan det är att båda sidor har SAMMA frekvenssvar. Man behöver inte ha 100% rakt frekvenssvar för att det ska låta bra. Ser man på en frekvensgraf kan man tycka att den är mycket olinjär, men faktum är att dips/toppar i frekvenssvar med maximalt 3-5dB inte har avgörande betydelse för ett välljudande system. Rattar man på EQ bör man alltid sänka amplituden och inte höja. Som jag sa i början är 3dB en effektfördubbling/halvering för slutsteget men inte för vår hörsel som kanske uppfattar en 20-30%-ig ökning/sänkning.
Vi börjar med vår hörsel. Dels hur hjärnan behandlar informationen som hjälper oss att lokalisera ursprunget av ett ljud och dels örats känslighet för fas och frekvenssvar. Örat skiljer sig en hel del från en mikrofons funktion som exempel. Vårt hörselsinne är inte linjärt, tvärtom varierar örats känslighet kraftigt mot olika frekvenser. Redan på slutet av 30-talet gjordes experiment inom isofoni (vårt intryck av ljudnivå vid olika frekvenser) av ett par gubbar som hette H. Fletcher och W. Munson, diagrammet som beskriver sambandet mellan volym/frekvens kallas därför Fletcher-Munson kurvan. Bild på detta kan ses nedan.
Som ni ser är örat exceptionellt känsligt vid frekvenser runt 2000-4000Hz och tappar känslighet över 10Khz. Hela basområdet har riktigt dålig känslighet vid lägre volymer men skillnaden jämnar ut sig desto högre den relativa volymen är. Från detta diagram kan man dra slutsatsen att runt 2-4Khz är vi väldigt känsliga för höga ljudtryck, detta förklarar hur vi tycker ljud kan vara "skärande" och det finns toppar i frekvensåtergivningen runt dessa frekvenser. Det förklarar även varför vi ofta vill ha lite extra tryck i basområdet. Man får tänka på att vi uppfattar en effektfördubbling/halvering vid ca 9-10dB och en akustisk fördubbling/halvering är 3dB, dvs vad en förstärkare "ser" som en effektfördubbling/halvering. Nu när vi vet hur vi uppfattar frekvens vs ljudnivå så kan vi gå in på hur vi lokaliserar ljud.
Detta är intressesant i högsta grad för det har att göra med hur man ställer in tidskomp och gain. För att göra en komplett en komplett tidskomp krävs mätinstrument p.g.a hörselsinnets begränsningar. Vårt hörselsinne kan med stor precision bestämma riktningen från olika källpunkter MEN med en viktig omständighet som begränsar våra möjligheter att ställa in tidskompen fullt ut. Denna begränsning är frekvensberoende, under ca 800Hz lokaliserar vi ljud via tidsskillnader mellan olika punkter. Över ca 800Hz avtar vår förmåga att lokalisera via tidsskillnader och istället tar förmågan att lokalisera via ljudvolym över! Vid ca 1600Hz blir volymen från olika källor dominant och tidskompet blir otroligt svårt att ställa in med hjälp av hörseln. Mellan dessa frekvenser (800-1600Hz) finns en slags gråzon där en blandning av båda sätten bestämmer lokalisering. Man får alltså känslan av att ljudkällans avstånd förändras när i själva verket endast dess intensitet förändras. Sammanfattningsvis kan man alltså tidskompa med öronen upp till ca 1,6Khz. Men det börjar bli svårt redan runt 800Hz att göra detta. Efter ca 1,6KHz får man nivåjustera sig fram tills man får en bra balanserad ljudscén. Så varför behöver man tidskompa efter denna gräns när det ändå inte har någon stor betydelse på våran ljudscén? Det är här vi kommer till begreppet fas. När vi tidskompar ställer vi själva verket in fasen mellan elementen och fasen spelar roll även efter vi tappar förmågan att riktningsbestämma med hjälp av den.
Runt delningsfrekvensen mellan högtalarelementen kan fasfel uppstå, detta är välkänt. Det som menas är att det finns en tidsskillnad mellan de olika elementens reproducerade ljud. Fasen kan liknas med en vattendamm. Släpper du en sten i dammen kommer vågor produceras och avta desto länge från källan de kommer. Tänk er vågornas höjd som ljudvolymen och avståndet mellan dom som frekvensen. När vi introducerar fas till vår liknelse måste vi ha två stenar som faller i dammen, ganska meningslöst annars. Tänk er nu två stycken stenar som ramlar ner i dammen från två olika sidor. Vågor kommer uppstå från båda hållen men vad händer när de möts? Här kommer det uppstå rippel i vågen. En del vågor neutraliseras medan andra förstärks, detta p.g.a att vågorna möts inte samtidigt. Fasen är inkorrekt. Om vi kan få vågorna att mötas på ett sådant sätt det skapas minimalt med rippel, minimalt med höga vågor och neutraliseringar kommer vi få vågor som samarbetar till att skapa ett harmoniskt system. Ett faskorrekt system. Detta kommer påverka frekvenssvaret (tätheten mellan vågorna) i form av rippel och resulterar i hörbart ljud. Vid högre frekvenser än 1,6KHz är vårt hörselsinne dåligt på att korrigera de tidsskillnader som orsakar ripplet i form av fasfel mellan elementen. Därför krävs mätutrustning om man inte vill sitta i evigheter och prova sig fram. En sak jag märkt är att instrument som reproducerar toner från ca 1Khz och uppåt kan man justera "djupet" på med en bra EQ. Genom att justera intensiteten vid olika frekvenser kan man få det att låta som ett instrument är längre ifrån eller närmare lyssningspositionen. Här gäller det att experimentera sig fram. Som vi nu vet angående vår hörsel, är återgivna frekvenser över ca 1,5-1,6Khz både känsliga för örat och lokaliseringsbestämmande. Detta ställer höga krav på det element som ska återge dessa frekvenser, samt dess montering. Ofta sköts dessa frekvenser av en midbas upp till 3-5Khz (generellt...), därefter brukar en diskant ta vid och återge frekvenser uppåt 20Khz. Det är nu vi kommer fram till diffraktion som har uteslutande med montering att göra. Jag hävdar med följande information att det kommer låta bättre att låta en diskant gå så lågt som möjligt (gärna 1500-1600Hz delning), kräver dock en diskant av bra kvalitet med riktigt lågt Fs (friluftsresonans). Anledning: Montering avsedd för kontrollering av diffraktion. Med ett bra element och skarp delning (18/24db/okt) tror jag i de flesta fall att det kommer bli en klar förbättring, det kommer bli ökad distorsion från elementet men att kontrollera diffraktionen väger tyngre.
Diffraktion är fenomen som är orsak till fler problem än vad många tror. På Linkwitz-Labs hemsida har tagit upp problemet men i mitt tycke underskattar Linkwitz dess betydelse. Diffraktion har både betydelse inom optik och inom ljud. Inom ljud kan de förstöra scénbilden, ge upphov till rippel i frekvenssvar och ge onaturligt och hårt ljud. Diffraktionen står i proportion till frekvensen som ska återges, då det handlar om våglängden. Desto längre våglängd, desto svårare att göra något åt diffraktionen för det blir till slut så långa våglängder att det är fysiskt ohanterbart i en bil. Detta fenomen handlar om att få bort tidiga reflektioner. Hårda kanter nära elementet är ofta en bov. Även plana ytor, montering nära rutor ger diffraktion. Det finns flera sätt att eliminera diffraktionen, det finns ett sätt som är smidigt dock. Till att börja med bör detta tillämpas på diskanter men det kan ha viss effekt på mellanregister beroende på hur höga frekvenser de återger. Det man gör är att man sprider ut reflektionen i tid och frekvens genom diffusion. Låter komplicerat? Det är faktiskt riktigt enkelt, bygg en låda till diskanterna som är formade som ett ägg eller boll. Det reflekterade ljudet kommer spridas runt "ägget" och sönderdelas över flera oktaver och över flera millisekunder tid och ripplet kommer minimeras. Direktljudet från högtalaren blir dominant och scénen kommer förbättras avsevärd. BoW har med sin high-end Nautilius högtalare förstått detta problem och byggt en låda utan hårda kanter som minimerar diffraktionen. Köp ett runt klot, dela det på mitten och placera elementet likt denna (ska vara i kanten, jäms med halvklotet):
Formeln är följande: 34290/nedre frekvens du vill kontrollera diffraktion/pi = Diameter på halvklotet. Dvs 34290/1000Hz (ex)/3,14 = 10,9cm diameter. Diffraktionen kommer kontrolleras ner till 1000Hz med 10,9cm halvklot.
Exempel på diffraktion:
Läs gärna hela tråden på diyma (Creds går till Patrick Bateman, trådskaparen): Soundstage/Diffraction
Sen lite om reflektioner, dessa brukar inte vara ett problem utan ger en känsla av rymd. Det viktiga är att reflektionerna dämpas och sker ett tag efter originalkällan reproducerar ljudet. Tidiga reflektioner måste antingen dämpas, absorberas eller bäst elimineras med hjälp av diffusion. Detta är mycket viktigt för en trevlig scén i bilen. Jag förespråkar mätning av allt tidsrelaterat och tonala skillnader mellan sidorna. Via mätning kan man se både tidiga reflektioner, sena reflektioner, fas mellan elementen och fas mellan sidorna. Man kan mäta distorsion och tonala problem mellan sidorna som kan ge upphov till inkorrekt scénbild. Men utan kunskap av vad man bör göra med datan man får av programmen och hur man ska tillämpa dom är man förmodligen bättre ute om man justerar med hörslen. Kan förstöra mer än vad man fixar. Eliminerar man problem med fas, diffraktion och tonala skillnader mellan sidorna kan man få mycket naturligt och bra scén i bilen. Det viktiga som jag märkt är att det är inte det totala frekvenssvaret som spelar den största rollen, utan det är att båda sidor har SAMMA frekvenssvar. Man behöver inte ha 100% rakt frekvenssvar för att det ska låta bra. Ser man på en frekvensgraf kan man tycka att den är mycket olinjär, men faktum är att dips/toppar i frekvenssvar med maximalt 3-5dB inte har avgörande betydelse för ett välljudande system. Rattar man på EQ bör man alltid sänka amplituden och inte höja. Som jag sa i början är 3dB en effektfördubbling/halvering för slutsteget men inte för vår hörsel som kanske uppfattar en 20-30%-ig ökning/sänkning.
Comment