Mp3 Le ta zgjidhim sipas radhës. Keqkuptime të zakonshme në lidhje me audio dixhitale Shkalla e bitit

23.10.2020

Marshimi triumfues i formatit të regjistrimit audio MPEG-1 Layer 3 (i quajtur bisedor MP3) shpjegohet me faktin se një metodë efektive kompresimi i një skedari audio që ju lejon të ruani deri në 12 orë muzikë me cilësi të pranueshme në një disk standard CD-ROM.

Ta themi thjesht, algoritmi MPEG-1 Layer 3 bazohet në të ashtuquajturën metodë e kompresimit "psikoakustike", kur frekuencat dhe nivelet e lartësisë që nuk janë të perceptueshme për veshin përjashtohen nga tingujt e spektrit. Spektri i "pastruar" në këtë mënyrë ndahet në blloqe (korniza) të ndara të së njëjtës kohëzgjatje dhe kompresohen në përputhje me kërkesat e specifikuara. Kur luhet, sinjali formohet nga një sekuencë kornizash të dekoduara.

Raporti i kompresimit varet nga parametrat e rrymës audio, të cilat duhet të dalin pas dekodimit të skedarit.

Parametri kryesor që përcakton cilësinë e zërit dhe raportin e ngjeshjes është e ashtuquajtura (çfarë është) bitrate është gjerësia e bandës, e matur në bit për sekondë.

Sa më i lartë të jetë numri, aq më e mirë është cilësia e zërit dhe aq më i ulët është raporti i shtypjes. Meqenëse pothuajse të gjitha skedarët MP3 regjistrohen në stereo me një normë kodimi prej 44 kHz dhe një thellësi prej 16 bitësh, faktorët përcaktues për tingullin e pastër janë: burimi i regjistrimit, kodeku i përdorur dhe shpejtësia e zgjedhur e bitit.

Fjala kodek është formuar duke kombinuar fjalët kodues + dekodues. Ky është një modul programi që ju lejon të kodifikoni ose dekodoni skedarët audio ose video në përputhje me algoritmin e tij.

Vlera mesatare e rrymës 256 kbps siguron një raport të ngjeshjes prej rreth 6: 1, për vlerat e tjera raporti i ngjeshjes ndryshon në mënyrë proporcionale. Kështu, me një transmetim 256 Kbps, ju mund të regjistroni muzikë nga gjashtë CD të rregullta Audio në një CD, dhe me një transmetim 128 Kbps, mund të regjistroni nga dymbëdhjetë disqe të rregullta muzikore.

Ekzistojnë polemika të pafundme midis amatorëve dhe profesionistëve në lidhje me shpejtësinë e bitit që siguron cilësi të mirë të zërit që përputhet me cilësinë e riprodhimit të një CD Audio.

Disa e konsiderojnë të mjaftueshme niveli prej 128 Kbps, të tjerët kënaqen vetëm nga vlera maksimale e rrjedhës - 320 Kbps. Sipas të gjitha gjasave, të dy kanë të drejtë - ndryshimi i vetëm është se çfarë regjistrohet dhe në çfarë kushtesh riprodhohet.

Bit-i në të cilin ishte kodifikuar audio e dixhitalizuar zakonisht tregohet në kopertinën e CD-së. Për shembull, koleksioni i plotë i Beatles është i disponueshëm në tre disqe 128Kbps ose gjashtë disqe 256Kbps.

Shtë e qartë se në rastin e dytë çmimi i blerjes do të jetë dy herë më i shtrenjtë, por edhe cilësia është më e mirë.

Nëse muzika luhet në një makinë të prodhuar në vend, transmetimi prej 192 Kbps do të sigurojë cilësi të mjaftueshme të zërit, më të mirën që akoma nuk do ta dëgjoni për shkak të zhurmës së huaj. Për të dëgjuar në kompjuter ose luajtës të pavarur ( MRZ-luajtës) Rryma prej 256 Kbps është e pranueshme.

Por nëse sinjali ushqehet i pandryshuar në një pajisje të jashtme dhe del në altoparlantë me cilësi të lartë, transmetimi maksimal i mundshëm është i dëshirueshëm - 320 Kbps. Bazuar në konsideratat e mësipërme, një rrymë prej 256 Kbps mund të konsiderohet universale: me një cilësi të mirë regjistrimi, ajo do të sigurojë riprodhim adekuat në shumicën e rasteve.

Për transmetimin e muzikës në Internet, zakonisht përdoret një shpejtësi bit 128 Kbps. Në të njëjtën kohë, cilësia e zërit "si të thuash" lë për të dëshiruar.

Nuk ka kuptim të regjistrosh muzikë popullore me një shkallë pak më të lartë se 192-256 Kbps: këngët nuk jetojnë gjatë, dhe regjistrimet origjinale shpesh nuk janë të një cilësie të lartë. Në fund, ju mund të kërceni nën tingullin e cilësisë "shirit".

Klasikët dhe veprat e rralla të autorësisë është një çështje tjetër. Dhe me klasikët nënkuptojmë jo vetëm Bach ose Mozart. Sot Beatles, Led, Zeppelin, Vysotsky, Tsoi dhe shumë autorë të tjerë (interpretues) mund të konsiderohen klasikë.

Nëse, kur blini një CD, nuk i keni kushtuar vëmendje vlerës së bitit të treguar në pako, atëherë mund të shihni vlerën në vijën e luajtësit gjatë riprodhimit të skedarit.

Bitrate (nga anglishtja). bitrate) i skedarëve audio është numri i bitëve (njësive të informacionit) që përdoren për të ruajtur një sekondë të një regjistrimi të zërit. Njësia më e zakonshme e matjes për bitrate është kilobitë për sekondë (Kbps, Kbps). Shkalla e bitit është një nga karakteristikat kryesore të skedarëve multimedial, duke ndikuar në cilësinë dhe madhësinë e tyre. Sa më i lartë të jetë shkalla e bitit që u regjistrua muzika ose video, aq më e mirë do të jetë cilësia e tyre dhe skedarët e regjistrimit "më të mëdhenj".

Prandaj, ndryshimi i bitrate-it në një drejtim ose në një tjetër mund të rrisë ose zvogëlojë madhësinë e skedarit. Por me ndikimin në cilësinë e regjistrimeve, gjithçka është pak më e komplikuar. Ndërsa një rënie në vlerën e bitrate natyrshëm çon në një përkeqësim të cilësisë së skedarit origjinal, operacioni i kundërt nuk ndikon në cilësinë në asnjë mënyrë. Edhe nëse vendosni bit-in maksimal, cilësia e audios dhe videos së skedarit tuaj do të mbetet e njëjtë.

Siç mund ta shihni, nuk ka asnjë pikë në rritjen e bitrate regjistrimit: si rezultat, ju do të merrni një skedar më të madh me të njëjtën cilësi. Por është shumë e mundur për të ulur bitrate në mënyrë që të zvogëlojë madhësinë e regjistrimit. Dëshironi të provoni të ndryshoni bitrat e këngëve ose filmave tuaj? Shkarkoni Movavi Video Converter - një program i dobishëm me të cilin mund të ndryshoni lehtësisht bitin e regjistrimeve video dhe audio, pavarësisht nëse ato janë skedarë në formatet e njohura MP3, WMA, AVI dhe MP4 ose regjistrime të vendosura në kontejnerë më ekzotikë. Udhëzimi është shkruar në shembullin e punës me skedarë audio.

1. Instaloni programin për të ndryshuar bitrate

Shkarkoni dhe ekzekutoni shpërndarjen Movavi Video Converter. Ndiqni udhëzimet në ekran për të instaluar softuerin. Kur instalimi të ketë përfunduar, konverteri do të fillojë automatikisht.

2. Shtoni skedarë në program

Klikoni butonin Shto skedarë, zgjidhni artikullin Shto audion dhe vendosni skedarët që dëshironi në program. Programi mbështet shumë formate mediatike, kështu që formati i skedarit të hyrjes mund të jetë pothuajse çdo. Ndryshoni bitën e skedarëve audio MP3, WMA, AAC dhe më shumë. Mundohuni të ulni bitën e videos: punoni me video në AVI, MP4, DIVX dhe formate të ndryshme video HD. Programi do t'ju ndihmojë të përballoni një gamë të gjerë të detyrave të konvertimit të mediave!

3. Zgjidhni formatin e ruajtjes

Para se të ndryshoni bit-in, duhet të zgjidhni formatin në të cilin do të ruhen regjistrimet tuaja audio. Për ta bërë këtë, klikoni në skedën Audio dhe zgjidhni formatin e duhur nga lista. Pasi të keni bërë një zgjedhje në favor të një ose një formati tjetër audio, klikoni në emrin e tij dhe nga lista zbritëse zgjidhni një nga vlerat e disponueshme të bitrate (opsioni nuk është i disponueshëm për formatet FLAC, OGG, WAV dhe M4A). Nëse nuk doni të ndryshoni vlerën standarde të bitrate-it të specifikuar në profilin e zgjedhur, mund të kaloni hapin tjetër dhe të vazhdoni me konvertimin.

4. Vendosni vlerën e dëshiruar të bitrate

Klikoni në butonin e ingranazhit në të djathtë të fushës Formati i daljes... Në listë Lloji i shpejtësisë së bitit zgjedh

Regjistrues i besueshëm dhe efikas i ekranit HD. Kapni video nga programet, transmetimet në internet dhe madje edhe bisedat Skype dhe ruani klipet në çdo format të njohur, si dhe për shikimin në pajisjet mobile.

Customshtë zakon të përdoret bitrate kur matet shpejtësia efektive e transmetimit të një rryme të dhënash mbi një kanal, domethënë madhësia minimale e një kanali që mund të kalojë këtë rrjedhë pa vonesa.

Shkalla e bitit shprehet në bit për sekondë (bps, bps), si dhe sasitë e prejardhura me parashtesat kilo- (kbit / s, kbps), mega- (Mbps, Mbps) etj

Shkalla e të dhënave duke përdorur bit për sekondë të një blloku (simboli: "bps"), që përdoret shpesh së bashku me parashtesat SI si "kilo" (1 kbps \u003d 1024 bps) , "Mega" (1 Mbps \u003d 1024 kbps), "giga" (1 Gbps \u003d 1024 Mbps), ose "tera" (1 Tbps \u003d 1024 Gbps). Shkurtesa jo standarde "bps" shpesh përdoret për të zëvendësuar karakterin standard "bps", kështu që për shembull, "1 Mbps" përdoret për të nënkuptuar një milion bit për sekondë. Një bajt për sekondë (1 Bps) korrespondon me 8 bit / s.

Specifikimet

Në formatet video dhe audio të transmetimit (për shembull, MPEG dhe MP3) që përdorin ngjeshje me humbje, parametri i shpejtësisë së bitit shpreh shkallën e kompresimit të rrjedhës dhe, në këtë mënyrë, përcakton madhësinë e kanalit për të cilin ngjeshet rryma e të dhënave. Më shpesh, bit-i i audios dhe videos matet në kilobit për sekondë (eng. kilobit për sekondë, kbps), më rrallë - në megabit për sekondë (vetëm për video).

Ekzistojnë tre mënyra të kompresimit për të dhënat e transmetimit:

CBR (inxh. Bitrate konstante) - me shpejtësi konstante bit;
VBR (inxh. Bit i ndryshueshëm) - me shpejtësi bit të ndryshueshme;
ABR (inxh. Bitrate mesatare) - me një normë mesatare bit.

Shkalla e transferimit të informacionit

Shtresa fizike e bit-it të pastër, bit-it, bit-it të dobishëm, frekuencës së ngarkesës, shpejtësisë neto të bit-it, shpejtësisë së bit-it të transmetimeve të koduara, shpejtësisë efektive të bit-it ose shpejtësisë së furnizimit të telit (gjuhë jozyrtare) e një kanali dixhital komunikimi është aftësia pa marrë parasysh lart protokollin e shtresës fizike. për një multipleks, një shembull i bitëve të kornizës së multipleksimit të ndarjes në kohë (TDM), kodet e rezervuara të korrigjimit të gabimit përpara (FEC), barazimin e simbolit të trajnimit dhe kodimin e kanaleve të tjera. Kodet e imunitetit ndaj zhurmës janë të zakonshme, veçanërisht në sistemet e komunikimit pa tel, standardet e modemit me bandë të gjerë, ose rrjetet moderne të zonës lokale me bazë bakri me shpejtësi të lartë. Shtresa fizike e bitës neto është shkalla e të dhënave e matur në një pikë referimi në ndërfaqen ndërmjet shtresa lidhëse dhe shtresa fizike, dhe për këtë arsye mund të përfshijë një lidhje të dhënash si dhe një ngarkesë të shtresës.

Në modemët dhe sistemet pa tela, shpesh zbatohet përshtatja e lidhjes (përshtatja automatike e shpejtësisë së të dhënave dhe modulimit dhe / ose gabimeve të skemës së kodimit, cilësia e sinjalit). Në këtë kontekst, termi bit i pikut i referohet bitës neto të mënyrës më të shpejtë dhe më pak të besueshme të transmetimit, e përdorur, për shembull, [kur distanca është shumë e shkurtër] ndërmjet dërguesit dhe transmetuesit. Disa sisteme operative dhe pajisjet e rrjetit mund të zbulojnë "shpejtësinë e lidhjes" (gjuhë jozyrtare) të një teknologjie të veçantë aksesi në rrjet ose pajisje komunikimi, e cila merr normën aktuale të transferimit të të dhënave neto. Duhet të theksohet se termi line line përcaktohet në disa libra shkollorë si bit bruto dhe në të tjerët si normë e pastër e të dhënave.

Marrëdhënia midis nivelit të bit të përgjithshëm dhe nivelit neto të të dhënave varet nga shkalla e kodit FEC sipas më poshtë.

Bitrate konstante

Bitrate konstante - një variant i kodimit të të dhënave streaming, në të cilin përdoruesi vendos fillimisht bit-in e kërkuar, i cili nuk ndryshon gjatë gjithë skedarit.

Përparësia e tij kryesore është aftësia për të parashikuar me saktësi madhësinë e skedarit përfundimtar.

Sidoqoftë, opsioni i bitës konstante nuk është shumë i përshtatshëm për veprat muzikore, tingulli i të cilave ndryshon dinamikisht me kalimin e kohës, pasi nuk siguron një raport optimal madhësie / cilësie.

Bit i ndryshueshëm

NGA bit i ndryshueshëm codec zgjedh vlerën e bitrate bazuar në parametrat (niveli i cilësisë së dëshiruar), dhe gjatë fragmentit të koduar, bitrate mund të ndryshojë. Kur kompresoni audion, shpejtësia e dëshiruar e bit përcaktohet bazuar në modelin psikoakustik. Kjo metodë jep raportin më të mirë të cilësisë / madhësisë së skedarit të prodhimit, por madhësia e saj e saktë rezulton të jetë shumë pak e parashikueshme. Në varësi të natyrës së zërit (ose imazhit, në rastin e kodimit të videos), madhësia e skedarit që rezulton mund të ndryshojë disa herë.

Bitrate mesatare

Bitrate mesatare është një hibrid i bitrateve konstante dhe të ndryshueshme: vlera në kbit / s vendoset nga përdoruesi, dhe programi e ndryshon atë brenda kufijve të caktuar. Sidoqoftë, ndryshe nga VBR, kodeku është i kujdesshëm për të përdorur vlerat maksimale dhe minimale të mundshme, pa rrezikuar të kalojë mesataren e specifikuar nga përdoruesi. Kjo metodë lejon vendosjen më fleksibile të shpejtësisë së përpunimit (për audio, ky mund të jetë çdo numër midis 8 dhe 320 kbps, kundrejt shumëfishave të 16 në metodën CBR) dhe me saktësi shumë më të madhe (krahasuar me VBR) në parashikimin e madhësisë së skedarit të daljes.

MP3

Një format i humbur compression audio MP3. Cilësia e zërit përmirësohet me rritjen e shpejtësisë së bitit:

32 kbps - Në përgjithësi është e pranueshme vetëm për të folur
96 kbps - Përdoret zakonisht për të folur me cilësi të ulët ose transmetim audio
128 ose 160 kbps - kodimi i muzikës në nivelin e hyrjes
192 kbps - cilësi e pranueshme e kodimit të muzikës
256 kbps - kodim i muzikës me cilësi të lartë
320 kbps - Cilësia më e lartë e kodimit e mbështetur nga standardi MP3

Audio tjetër

700 bps është shpejtësia më e ulët e bit-it e përdorur nga kodeksi i të folurit me kod të hapur Codec2; zëri mezi njihet, shpejtësia bit 1,2 kbps jep tingull shumë më të mirë
800 bit / s - niveli minimal i kërkuar për njohjen e fjalës, i përdorur në kodekët e specializuar të fjalës FS-1015
2.15 kbps - bit bit minimal i kodeksit Speex me burim të hapur
6 kbps - bit bit minimale për kodeksin Opus me burim të hapur
8 kbps - cilësia e zërit të telefonit duke përdorur kodekët e të folurit

Këtu do të shikojmë se si të zgjedhim bitën e duhur për transmetimin tuaj në Internet. Dhe kështu, Bitrate është cilësia e videos. Sa më e lartë të jetë, aq më e lartë është cilësia. Nëse krijoni një transmetim me cilësi të lartë me një pamje të shkëlqyeshme, thjesht duhet të rrisni bit-in dhe kaq? Pavarësisht se si është. Transmetimi pastaj shkon në internet, përkatësisht, e gjithë kjo bit i lartë është i zënë nga kanali i Internetit dhe do të jetë e pamundur ta shikosh atë. Prandaj, duhet të merrni në konsideratë mundësitë e Internetit tuaj dhe Internetit të audiencës suaj. Jo të gjithë kanë kabllo me fibra optike. Kështu që nuk rekomandohet të vendosni bitën mbi 2 Mbps.

Gjëja e dytë që duhet kushtuar vëmendje është e ashtuquajtura raport bit / pixel. Kjo formulë duket e thjeshtë:

bit / (piksele * korniza)

Çfarë do të thotë kjo formulë? Le të themi se ne kodojmë një transmetim me një rezolucion prej 100px x 100px, me 25 fps (korniza për sekondë) dhe vendosim bitrate në 250 kbps (kilobit për sekondë). Pra, për një sekondë, një video me një madhësi prej 10,000 pixel (njëqind herë njëqind) ndahen 25 korniza dhe 250 kilobit. Ka 10 kilobitë (10000 bit) për secilin kornizë (250/25). Ne ndajmë bitët e alokuar për kornizë me madhësinë në pixel - marrim raportin bit / pixel - sa informacion është alokuar për të "koduar" një pixel.

Sa më shumë informacion të theksohet, aq më e lartë është cilësia.

Në shembullin tonë, raporti bit / pixel është: (10,000 bit për kornizë) / (10,000 pixels) \u003d 1. Do të jetë shumë. Cilësi mjaft e shkëlqyeshme mund të merret me respekt 0,1 -0,15 ... Për shembullin tonë, një shpejtësi bit prej 32-35 kbps do të ishte e mjaftueshme.

Le të llogarisim raportet e përafërta bit / pixel për rezolucionet më të zakonshme:

720p: 1280 × 720 pixel:

Bitrate 1500kbps - 1500000 / ((1280 * 720) * 25) \u003d 1500000/23040000 \u003d 0,065
Bitrate 2500kbps - 2500000 / ((1280 * 720) * 25) \u003d 2500000/23040000 \u003d 0.109
Bitrate 3500kbps - 3500000 / ((1280 * 720) * 25) \u003d 3500000/23040000 \u003d 0.152

1080p: 1920 × 1080 pixel:

Bitrate 1500kbps - 1500000 / ((1920 * 1080) * 25) \u003d 1500000/51840000 \u003d 0,029 ( siç mund ta shihni, cilësia në të njëjtën bitrate do të jetë rreth 2.5 herë më e keqe, kështu që 1080p ka nevojë për bitrate më të lartë se 720p)
Bitrate 5000kbps - 5,000,000 / ((1920 * 1080) * 25) \u003d 5,000,000 / 23040000 \u003d 0,096
Bitrate 7500kbps - 7500000 / ((1920 * 1080) * 25) \u003d 7500000/23040000 \u003d 0,145
Bitrate 10000kbps - 10000000 / ((1920 * 1080) * 25) \u003d 10000000/23040000 \u003d 0.192

Çfarë përfundimesh mund të nxirren? Së pari, është gjithashtu gjëja kryesore, nuk mund të siguroni rezolucionin me bit-in e kërkuar - mos u përpiqni të transmetoni. Dëshiron të transmetosh gjithsesi? Ulni ose rezolucionin ose fps. Përfundoni pak / pixel të paktën deri në 0,075-0,1, ose më mirë, më shumë.

Cilësia

Rezolucioni

Bitrate video,kbps

Bitrate audio,kbps

Korniza FPS / sek

Kodek video

h.264profili

Kodek audio

Kanali audio

240 f (426 x 240)

400 (300-700)

SHKSH ose MP3

270 fq (480x270)

400 (300-700)

SHKSH ose MP3

360p (640x360)

750 (400-1000)

SHKSH ose MP3

480p (854x480)

1000 (500-2000)

SHKSH ose MP3

540p (960x540)

1000 (800 - 2000)

SHKSH ose MP3

Mono ose
Stereo

720p (1280x720)

2500 (1560-4000)

SHKSH ose MP3

Mono ose
Stereo

720p (1280x720)

3800 (2500-6000)

SHKSH ose MP3

Mono ose
Stereo

1080p (1920x1080)

4500 (3000-6000)

SHKSH ose MP3

Mono ose
Stereo

1080p (1920x1080)

6800 (4500-9000)

SHKSH ose MP3

Mono ose
Stereo

1440p) (2560x1440)

9000 (6000-13000)

SHKSH ose MP3

Mono ose
Stereo

1440p (2560x1440)

13000 (9000-18000)

SHKSH ose MP3

Mono ose
Stereo

4K / 2160p (3840x2106)

23000 (13000-34000)

SHKSH ose MP3

Mono ose
Stereo

4K / 2160p (3840x2106)

35000 (20000-51000)

SHKSH ose MP3

Mono ose
Stereo

Shtëpi / Udhëzime / Përzgjedhja e bitës për transmetimin

shënim: Për një kuptim më të mirë të tekstit më poshtë, ju rekomandoj shumë që të njiheni me bazat e audios dixhitale.

S: Sa më i lartë bit-i, aq më e mirë është pista

R: Kjo nuk është gjithmonë rasti. Së pari, më lejoni t'ju kujtoj se çfarë është bitrey t (bitrate, jo bitraid). Në fakt, kjo është shkalla e të dhënave në kilobit për sekondë gjatë riprodhimit. Kjo është, nëse marrim madhësinë e pistës në kilobit dhe ndajmë me kohëzgjatjen e saj në sekonda, ne marrim bitrat e tij - të ashtuquajturën. bitrate e bazuar në skedar (FBR), zakonisht nuk ndryshon shumë nga bit-i i rrjedhës audio (arsyeja e ndryshimeve është prania e meta të dhënave në titull - etiketat, imazhet "e ngulitura", etj.).

Tani le të marrim një shembull: bit-i i audios PCM të pakompresuar të regjistruar në një CD Audio të rregullt llogaritet si më poshtë: 2 (kanale) * 16 (bit për shembull) * 44100 (mostra për sekondë) \u003d 1411200 (bps) \u003d 1411.2 kbps ... Tani le të marrim dhe kompresojmë pjesën me çdo kodek pa humbje ("pa humbje" - "pa humbje", domethënë, një që nuk çon në humbjen e ndonjë të dhëne), për shembull, kodekin FLAC. Si rezultat, ne do të kemi një bitrate më të ulët se ai origjinal, por cilësia do të mbetet e pandryshuar - këtu është përgënjeshtrimi juaj i parë.

Diçka tjetër ia vlen të shtohet këtu. Bit-i i daljes me kompresim pa humbje mund të jetë shumë i ndryshëm (por, si rregull, është më pak se ai i audios së pakompresuar) - varet nga kompleksiteti i sinjalit të kompresuar, ose më mirë nga teprica e të dhënave. Kështu, sinjalet më të thjeshta do të ngjeshen më mirë (d.m.th. kemi një madhësi më të vogël skedari për të njëjtën kohëzgjatje \u003d\u003e shpejtësi më të ulët bit), dhe sinjalet më komplekse do të jenë më keq. Kjo është arsyeja pse muzika klasike pa humbje ka një shpejtësi më të ulët se, të themi, rock. Por duhet theksuar që shpejtësia e bit-it këtu nuk është aspak një tregues i cilësisë së materialit zanor.

Tani le të flasim për kompresimin me humbje (humbje). Para së gjithash, duhet të kuptoni se ka shumë enkodues dhe formate të ndryshme, madje edhe brenda të njëjtit format, cilësia e kodimit për enkodues të ndryshëm mund të ndryshojë (për shembull, QuickTime AAC kodon shumë më mirë sesa FAAC të vjetëruar), për të mos përmendur epërsinë e formateve moderne (OGG Vorbis, AAC , Opus) mbi MP3. Ta themi thjesht, nga dy këngë identike të koduara nga enkodues të ndryshëm me të njëjtën bitrate, disa do të tingëllojnë më mirë dhe disa do të tingëllojnë më keq.

Përveç kësaj, ekziston një gjë e tillë si kthyeshëm... Kjo është, ju mund të merrni një titull në format MP3 me një bitrate prej 96 kbps dhe ta ktheni atë në MP3 320 kbps. Jo vetëm që cilësia nuk do të përmirësohet (në fund të fundit, të dhënat e humbura gjatë kodimit të mëparshëm 96 kbps nuk mund të kthehen), madje do të përkeqësohen. Vlen të theksohet se në secilën fazë të kodifikimit me humbje (me çdo shpejtësi bit dhe çdo kodues) një pjesë e caktuar e shtrembërimit futet në audio.

Dhe akoma më shumë. Ekziston edhe një nuancë tjetër. Nëse, të themi, bit-i i një transmetimi audio është 320 kbps, kjo nuk do të thotë që të gjitha 320 kbps janë shpenzuar në kodimin atë sekondë. Kjo është tipike për kodimin me bit të vazhdueshëm dhe për ato raste kur një person, duke shpresuar të marrë maksimumin, cilësia detyron një shpejtësi konstante shumë të lartë (për shembull, vendosja e 512 kbps CBR për Nero AAC). Siç e dini, numri i bitëve të alokuar në një kornizë të caktuar rregullohet nga modeli psikoakustik. Por në rastin kur shuma e alokuar është shumë më e ulët se bit-i i caktuar, atëherë edhe rezervuari i bitëve nuk kursen (për termat, shih artikullin "Çfarë është CBR, ABR, VBR?") - si rezultat, ne marrim "zero bit" të padobishme që thjesht "përfundojnë" »Madhësia e kornizës në atë të kërkuar (p.sh., rritni madhësinë e rrymës në atë të specifikuar). Nga rruga, kjo është e lehtë për t'u kontrolluar - ngjesh skedarin që rezulton me një arkivues (mundësisht 7z) dhe shikoni në raportin e ngjeshjes - sa më shumë që është, aq më shumë zero zero (pasi ato çojnë në tepricë), aq më shumë hapësirë \u200b\u200be humbur.

S: DVD-Audio tingëllon më mirë se Audio CD (24 bit vs 16, 96 kHz vs 44.1, etj.)

R: në parim, kjo është mjaft logjike, madje edhe pjesërisht e vërtetë, por vetëm njerëzit zakonisht shikojnë vetëm numra dhe shumë rrallë mendojnë për ndikimin e një ose një parametri tjetër.

Pra, le të shohim së pari thellësinë e bitit. Ky parametër nuk është përgjegjës për asgjë më shumë se diapazoni dinamik, d.m.th. për ndryshimin midis tingujve më të qetë dhe më të lartë (në dB). Në audio dixhitale, niveli maksimal është 0 dBFS, dhe minimumi është i kufizuar nga niveli i zhurmës, domethënë, në fakt, diapazoni dinamik është i barabartë me nivelin e zhurmës në vlerë absolute. A llogaritet diapazoni dinamik si regjistër 20 * (2 ^ 16) për audio 16-bit? 96,33 (dB) Diapazoni dinamik i një orkestre simfonike është deri në 75 dB (kryesisht rreth 40-50 dB).

Tani le të imagjinojmë kushtet reale. Niveli i zhurmës në dhomë është rreth 40 dB (mos harroni se dB është një vlerë relative. Në këtë rast, pragu i dëgjimit merret si 0 dB), vëllimi maksimal i muzikës arrin 110 dB (në mënyrë që të mos ketë shqetësime) - ne marrim një ndryshim prej 70 dB. Kështu, rezulton se një diapazon dinamik prej më shumë se 70 dB në këtë rast është thjesht i padobishëm. Kjo është, në një diapazon më të lartë, ose tinguj të fortë do të arrijnë pragun e dhimbjes, ose tingujt e qetë do të përthithen nga zhurma përreth. Veryshtë shumë e vështirë të arrihet një nivel i zhurmës në ambient më pak se 15 dB (pasi ky nivel është lartësia e frymëmarrjes njerëzore dhe zhurmat e tjera të shkaktuara nga faktori njerëzor), si rezultat, një interval prej 95 dB për të dëgjuar muzikë është plotësisht i mjaftueshëm.

Tani në lidhje me shkallën e kampionimit (shkalla e marrjes së mostrës, shkalla e mostrës). Ky parametër është përgjegjës për shpejtësinë e marrjes së mostrës në kohë dhe ndikon drejtpërdrejt në frekuencën maksimale të sinjalit që mund të përshkruhet nga kjo paraqitje audio. Sipas teoremës së Kotelnikov, është e barabartë me gjysmën e normës së marrjes së mostrave. Kjo është, për një frekuencë normale të marrjes së mostrave prej 44100 Hz, frekuenca maksimale e përbërësve të sinjalit është 22050 Hz. Frekuenca maksimale. e cila perceptohet nga veshi i njeriut - pak më shumë se 20,000 Hz (dhe madje edhe atëherë, në lindje; ndërsa plakemi, pragu bie në 16,000 Hz).

Lexoni Shkarkimet 24/192 - pse nuk kanë kuptim.

S: Lojtarët e ndryshëm të programeve tingëllojnë ndryshe (p.sh. foobar2000 është më i mirë se Winamp, etj.)

R: Për të kuptuar pse nuk është kështu, duhet të kuptoni se çfarë është një lojtar softuerësh. Në fakt, ky është një dekodues, mbajtës (opsional), një shtojcë dalëse (në njërën nga ndërfaqet: ASIO, DirectSound, WASAPI etj.), Dhe natyrisht një GUI (përdorues). Meqenëse dekoduesi në 99.9% të rasteve punon sipas algoritmit standard, dhe plug-in e daljes është vetëm një pjesë e programit që transmeton një transmetim në kartën e zërit përmes njërës prej ndërfaqeve, arsyeja e ndryshimeve mund të jenë vetëm mbajtësit. Por fakti është që mbajtësit zakonisht janë me aftësi të kufizuara (ose duhet të çaktivizohen, pasi gjëja kryesore për një lojtar të mirë është të jetë në gjendje të transmetojë tinguj në formën e tij "origjinale"). Si rezultat, tema e krahasimit këtu mund të jetë vetëm aftësive përpunimi dhe prodhimi, i cili, nga rruga, është shumë shpesh i panevojshëm. Por edhe nëse ekziston një nevojë e tillë, atëherë ky është tashmë një krahasim i mbajtësve, jo i lojtarëve.

Këtu do të doja gjithashtu të përmendja timen dhe, ndoshta, për të mërzitur përdoruesit që admirojnë ndryshimet "kolosale" në tingull pas cilësimeve të përshkruara në të - në 95% të rasteve kjo është vetë-hipnozë (përveç, natyrisht, kur gjatë vendosjes së saj disa " përmirësues "ose një procesor tjetër që prish tërë pamjen). Mjerisht, fitimet nga të gjitha këto rregullime me ReplayGain, rishikuesit dhe kufizuesit janë të pakta. Përfundim: nëse doni tingull me të vërtetë me cilësi të lartë, blini vetes akustikë Hi-Fi dhe një kartë zanore profesionale.

S: Versione të ndryshme të shoferit tingëllojnë ndryshe

R: Kjo deklaratë bazohet në një injorancë banale të parimeve të funksionimit të kartës së zërit. Një drejtues është një softuer që kërkohet që pajisja të komunikojë në mënyrë efektive me sistemin operativ dhe zakonisht siguron një ndërfaqe grafike përdorimi për të kontrolluar pajisjen, cilësimet e saj, etj. Një drejtues i kartës së zërit siguron që karta e zërit të njihet si e shëndoshë, informon OS për formatet e mbështetura nga karta , siguron transferimin e një rryme PCM (zakonisht) të pakompresuar në kartelë, dhe gjithashtu jep mundësi hyrje në cilësimet. Përveç kësaj, në rastin e përpunimit të softuerit (me anë të CPU-së), shoferi mund të përmbajë DSP të ndryshme (mbajtës). Prandaj, së pari, me efekte të paafta dhe përpunim, nëse shoferi nuk siguron transferimin e saktë të PCM në kartë, ky konsiderohet një gabim i rëndë, një gabim kritik. Dhe kjo ndodh rrallë... Nga ana tjetër, ndryshimet midis drejtuesve mund të jenë në azhurnimin e algoritmeve të përpunimit (rishikuesit, efektet), megjithëse kjo gjithashtu ndodh shumë rrallë. Për më tepër, efektet dhe çdo përpunim i drejtuesit duhet të çaktivizohen / anashkalohen për të arritur cilësinë më të lartë.

Kështu, azhurnimet e drejtuesve janë përqendruar kryesisht në përmirësimin e stabilitetit dhe rregullimin e gabimeve të trajtimit. Në rastin tonë, as njëra dhe as tjetra nuk ndikojnë në cilësinë e riprodhimit, prandaj në 999 raste nga 1000 shoferi nuk ndikon në tingull.

S: CD-të e licencuara Audio tingëllojnë më mirë se kopjet e tyre

R: Nëse nuk ka ndodhur asnjë gabim (fatal) i leximit / shkrimit gjatë kopjimit dhe makinë optike pajisja në të cilën do të luhet disku kopjues, nuk ka probleme me leximin e tij, atëherë një deklaratë e tillë është e gabuar dhe hidhet poshtë lehtësisht.

S: Modaliteti i kodimit stereo jep cilësi më të mirë se stereoja e përbashkët

R: Ky keqkuptim ka të bëjë kryesisht me LAME MP3, pasi përdorin të gjithë koduesit modernë (AAC, Vorbis, Musepack) vetëmmodaliteti i përbashkët stereo (dhe kjo tashmë po flet për diçka)

Për fillestarët, vlen të përmendet se modaliteti i përbashkët stereo përdoret me sukses me kompresim pa humbje. Thelbi i tij qëndron në faktin se sinjali para kodimit zbërthehet në shumën e kanaleve të djathtë dhe të majtë (Mid) dhe ndryshimin e tyre (Ana), dhe pastaj këto sinjale kodohen veçmas. Në kufi (për të njëjtin informacion në kanalin e djathtë dhe të majtë), merren kursime të dyfishta të të dhënave. Dhe meqenëse në shumicën e muzikës informacioni në kanalet e djathtë dhe të majtë është mjaft i ngjashëm, kjo metodë është shumë efektive dhe ju lejon të rrisni ndjeshëm raportin e kompresimit.

Në humbje, parimi është i njëjtë. Por këtu, në modalitetin e bitrateve konstante, cilësia e fragmenteve me informacion të ngjashëm në dy kanale do të rritet (në kufi, ajo do të dyfishohet), dhe për mënyrën VBR në vende të tilla, bitrate thjesht do të ulet (mos harroni se detyra kryesore e modalitetit VBR është të ruajë në mënyrë të qëndrueshme cilësinë e specifikuar të kodimit, duke përdorur bit-in më të ulët të mundshëm). Meqenëse gjatë kodimit me humbje, përparësia (në caktimin e bitëve) i jepet shumës së kanaleve për të shmangur degradimin e panoramës stereo, përdoret kalimi dinamik midis mënyrave stereo të kornizës së përbashkët (Mid / Side) dhe normale (Left / Right). Nga rruga, arsyeja për këtë mashtrim ishte papërsosmëria e algoritmit të kalimit në versionet e vjetra të LAME, si dhe prania e modalitetit të Forcës së Përbashkët, në të cilën nuk ka ndërrim automatik. Në versionet e fundit të LAME, mënyra e përbashkët është aktivizuar si parazgjedhje dhe nuk rekomandohet ta ndryshoni atë.

S: Sa më i gjerë të jetë spektri, aq më i mirë është regjistrimi (rreth spektrogramëve, auCDtect dhe intervalit të frekuencës)

R: Në ditët e sotme në forume, për fat të keq, është shumë e zakonshme të matësh cilësinë e një piste me një "vizore në spektrogram". Padyshim, për shkak të thjeshtësisë së kësaj metode. Por, siç tregon praktika, në realitet gjithçka është shumë më e komplikuar.

Dhe çështja është kjo. Spektrogrami demonstron vizualisht shpërndarjen e fuqisë së sinjalit mbi frekuencat, por nuk mund të japë një pamje të plotë të tingullit të regjistrimit, pranisë së shtrembërimeve dhe artefakteve të kompresimit në të. Kjo është, në fakt, gjithçka që mund të përcaktohet nga spektrogrami është diapazoni i frekuencës (dhe pjesërisht - dendësia e spektrit në rajonin HF). Kjo është, në rastin më të mirë, duke analizuar spektrogramin, mund të identifikoni kthyesin. Krahasimi i spektrogramëve të pjesëve të marra nga kodimi nga enkodues të ndryshëm me origjinalin është një absurditet i dukshëm. Po, ju mund të identifikoni ndryshimet në spektër, por përcaktimi nëse ato do të perceptohen (dhe në çfarë mase) nga veshi i njeriut është pothuajse e pamundur. Ne nuk duhet të harrojmë se detyra e kodimit me humbje është të sigurojë një rezultat të padallueshëm veshi i njeriut nga origjinali (jo me sy).

E njëjta gjë vlen për vlerësimin e cilësisë së kodimit duke analizuar gjurmët e daljes me programin auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect janë thjesht predha për programin e konzolës auCDtect të një lloji). Algoritmi auCDtect gjithashtu në fakt analizon diapazonin e frekuencës dhe vetëm ju lejon të përcaktoni (me një shkallë të caktuar të probabilitetit) nëse compression MPEG është aplikuar në ndonjë nga fazat e kodimit. Algoritmi është përshtatur për MP3, kështu që është e lehtë të "mashtrosh" duke përdorur kodekët Vorbis, AAC dhe Musepack, kështu që edhe nëse programi shkruan "100% CDDA" nuk do të thotë që audio e koduar është 100% identike me atë origjinale.

Dhe, duke u kthyer direkt në spektra. Gjithashtu e njohur është dëshira e disa "entuziastëve" për të fikur me të gjitha mënyrat filtrin e kalimit të ulët në koduesin LAME. Ekziston një mungesë e të kuptuarit të parimeve të kodimit dhe psikoakustikës. Së pari, kodifikuesi shkurton frekuencat e larta vetëm për një qëllim - të ruajë të dhëna dhe t'i përdorë ato për të kodifikuar intervalin më të dëgjueshëm të frekuencës. Diapazoni i zgjeruar i frekuencës mund të ketë një efekt fatal në cilësinë e përgjithshme të zërit dhe të çojë në objekte të kodimit të dëgjueshëm. Për më tepër, fikja e ndërprerjes në 20 kHz është përgjithësisht plotësisht e pajustifikuar, pasi një person thjesht nuk dëgjon frekuencat më lart.

S: Ekziston një lloj i paravendosur EQ "magjik" që mund të përmirësojë ndjeshëm tingullin

R: Kjo nuk është plotësisht e vërtetë, së pari, sepse secili merr konfigurimin veç e veç (kufje, akustikë, karta e zërit) ka parametrat e vet (në veçanti, karakteristikën e tij amplituda-frekuencë). Prandaj, çdo konfigurim duhet të ketë qasjen e vet, unike. Ta themi thjesht, ekziston një paravendosje e tillë e EQ, por është e ndryshme për konfigurime të ndryshme. Thelbi i tij qëndron në rregullimin e përgjigjes së frekuencës së shtegut, domethënë, në "nivelimin" e zhytjeve dhe valëve të padëshiruara.

Gjithashtu, mes njerëzve që nuk punojnë drejtpërdrejt me zërin, vendosja e barazuesit grafik me një "shenjë" është shumë e popullarizuar, e cila në të vërtetë përfaqëson një rritje në nivelin e komponentëve të frekuencës së ulët dhe të lartë, por në të njëjtën kohë çon në mbytje të vokaleve dhe instrumenteve, spektri i tingullit i të cilave është në mes të mesit ...

S: Para se ta shndërroni muzikën në një format tjetër, duhet ta "dekompresoni" në WAV

R: Unë do të doja të theksoja menjëherë se WAV do të thotë të dhëna PCM (modulimi i kodit të pulsit) në një enë WAVE (skedari me shtrirje * .wav). Këto të dhëna nuk janë asgjë më shumë se një sekuencë bitësh (zero dhe njësi) në grupe prej 16, 24 ose 32 (në varësi të thellësisë së bitit), secila prej të cilave është një kod binar i amplitudës së mostrës përkatëse (për shembull, për 16 bit në shënim dhjetor këto janë vlera nga -32768 në +32768).

Pra, fakti është që çdo përpunues i zërit - qoftë filtër apo kodues - zakonisht funksionon vetëm me këto vlera, dmth vetëm me të dhëna të pakompresuara. Kjo do të thotë që për të kthyer audio nga, të themi, FLAC në APE, thjesht e nevojshme deshifroj FLAC në PCM së pari dhe pastaj kodoj PCM në APE. Likeshtë si të ripaketosh skedarët nga ZIP në RAR, së pari duhet të shpaketosh ZIP.

Sidoqoftë, nëse përdorni një konvertues ose vetëm një kodues të avancuar të konsolës, shndërrimi i ndërmjetëm në PCM ndodh në lëvizje, ndonjëherë edhe pa shkruar në një të përkohshëm Skedar WAV... Kjo është ajo që i mashtron njerëzit - duket se formatet konvertohen drejtpërdrejt në njëri-tjetrin, por në fakt, një program i tillë domosdoshmërisht ka një dekodues të formatit të hyrjes që kryen një shndërrim të ndërmjetëm në PCM.

Kështu, shndërrimi manual në WAV nuk do t'ju japë absolutisht asgjë përveç humbjes së kohës.

Shkalla e bitit shprehet në bit për sekondë (bps, bps), si dhe sasitë e prejardhura me parashtesat kilo- (kbit / s, kbps), mega- (Mbps, Mbps) etj

Shkalla e të dhënave duke përdorur bit për sekondë të një blloku (simboli: "bps"), që përdoret shpesh së bashku me parashtesat SI si "kilo" (1 kbps \u003d 1024 bps) , "Mega" (1 Mbps \u003d 1024 kbps), "giga" (1 Gbps \u003d 1024 Mbps), ose "tera" (1 Tbps \u003d 1024 Gbps). Shkurtesa jo standarde "bps" shpesh përdoret për të zëvendësuar karakterin standard "bps", kështu që për shembull "1 Mbps" përdoret për të nënkuptuar një milion bit për sekondë. Një bajt për sekondë (1 Bps) korrespondon me 8 bps.

YouTube enciklopedik

1 / 5
Në formatet video dhe audio të transmetimit (për shembull, MPEG dhe MP3) që përdorin kompresim me humbje, parametri i bitrate shpreh shkallën e kompresimit të rrjedhës dhe në këtë mënyrë përcakton madhësinë e kanalit për të cilin kompresohet transmetimi i të dhënave. Më shpesh, bit-i i audios dhe videos matet në kilobit për sekondë (anglisht kilobit për sekondë, kbps), më rrallë - në megabit për sekondë (vetëm për video).
Ekzistojnë tre mënyra të kompresimit për të dhënat e transmetimit:
- CBR (Bitte konstante angleze) - me bit të vazhdueshëm;
- VBR (Shifra e ndryshueshme angleze) - me shpejtësi të ndryshueshme;
- ABR (Bitrate mesatare angleze) - me një bitrate mesatare.
Shkalla e transferimit të informacionit

Shtresa fizike e bit-it të pastër, bit-it, bit-it të dobishëm, frekuencës së ngarkesës së ngarkesës, shpejtësisë neto të bit-it, shpejtësisë së bit-it të transmetimeve të koduara, shpejtësisë efektive të bit-it ose shpejtësisë së furnizimit të telit (gjuha jozyrtare) e një kanali dixhital të komunikimit është aftësia pa marrë parasysh lart shpenzimet e protokollit të shtresës fizike. për një multipleks, një shembull i bitëve të kornizës së multipleksimit të ndarjes në kohë (TDM), kodet e rezervuara të korrigjimit të gabimit përpara (FEC), barazimin e simbolit të trajnimit dhe kodimin e kanaleve të tjera. Kodet kundër bllokimit janë të zakonshme, veçanërisht në sisteme pa tel, standardet e modemit me bandë të gjerë ose me shpejtësi të lartë moderne rrjetet lokale bazuar në bakër. Shtresa fizike e bitës neto është shkalla e të dhënave e matur në një pikë referimi në ndërfaqen midis shtresës së lidhjes dhe shtresës fizike, dhe për këtë arsye mund të përfshijë lidhjen e të dhënave, si dhe ngarkesën e shtresës.
Në modemët dhe sistemet pa tela, shpesh zbatohet përshtatja e lidhjes (përshtatja automatike e shpejtësisë së të dhënave dhe modulimit dhe / ose gabimeve të skemës së kodimit, cilësia e sinjalit). Në këtë kontekst, termi bit i pikut i referohet bitës neto të mënyrës më të shpejtë dhe më pak të besueshme të transmetimit, e përdorur, për shembull, [kur distanca është shumë e shkurtër] ndërmjet dërguesit dhe transmetuesit. Disa sisteme operative dhe pajisjet e rrjetit mund të zbulojnë "shpejtësinë e lidhjes" (gjuhë jozyrtare) të një teknologjie të veçantë aksesi në rrjet ose pajisje komunikimi, e cila merr normën aktuale të transferimit të të dhënave neto. Duhet të theksohet se termi line line përcaktohet në disa libra shkollorë si bit bruto dhe në të tjerët si normë e pastër e të dhënave.
Marrëdhënia midis nivelit të bit të përgjithshëm dhe nivelit neto të të dhënave varet nga shkalla e kodit FEC sipas më poshtë.

Bitrate konstante

Bitrate konstante - një variant i kodimit të të dhënave streaming, në të cilin përdoruesi vendos fillimisht bit-in e kërkuar, i cili nuk ndryshon gjatë gjithë skedarit.
Përparësia e tij kryesore është aftësia për të parashikuar me saktësi madhësinë e skedarit përfundimtar.
Sidoqoftë, opsioni i bitës konstante nuk është shumë i përshtatshëm për veprat muzikore, tingulli i të cilave ndryshon dinamikisht me kalimin e kohës, pasi nuk siguron një raport optimal madhësie / cilësie.

Bit i ndryshueshëm

NGA bit i ndryshueshëm codec zgjedh vlerën e bitrate bazuar në parametrat (niveli i cilësisë së dëshiruar), dhe gjatë fragmentit të koduar, bitrate mund të ndryshojë. Kur kompresoni audion, shpejtësia e dëshiruar e bit përcaktohet bazuar në modelin psikoakustik. Kjo metodë jep raportin më të mirë të cilësisë / madhësisë së skedarit të daljes, por madhësia e saj e saktë rezulton të jetë shumë pak e parashikueshme. Në varësi të natyrës së zërit (ose imazhit, në rastin e kodimit të videos), madhësia e skedarit që rezulton mund të ndryshojë disa herë.

Bitrate mesatare

Bitrate mesatare është një hibrid i bitrateve konstante dhe të ndryshueshme: vlera në kbit / s vendoset nga përdoruesi, dhe programi e ndryshon atë brenda kufijve të caktuar. Sidoqoftë, ndryshe nga VBR, kodeku është i kujdesshëm për të përdorur vlerat maksimale dhe minimale të mundshme, pa rrezikuar të kalojë mesataren e specifikuar nga përdoruesi. Kjo metodë lejon vendosjen më fleksibile të shpejtësisë së përpunimit (për audio, ky mund të jetë çdo numër midis 8 dhe 320 kbps, kundrejt shumëfishave të 16 në metodën CBR) dhe me saktësi shumë më të madhe (krahasuar me VBR) në parashikimin e madhësisë së skedarit të daljes.

MP3

Një format i humbur compression audio MP3. Cilësia e zërit përmirësohet me rritjen e shpejtësisë së bitit:
- 32 kbps - Në përgjithësi është e pranueshme vetëm për të folur
- 96 kbps - Përdoret zakonisht për të folur me cilësi të ulët ose transmetim audio
- 128 ose 160 kbps - kodimi i muzikës në nivelin e hyrjes
- 192 kbps - cilësi e pranueshme e kodimit të muzikës
- 256 kbps - kodim i muzikës me cilësi të lartë
- 320 kbps - Cilësia më e lartë e kodimit e mbështetur nga standardi MP3
Gjatë viteve të fundit, formati MP3 është bërë jashtëzakonisht i modës dhe i popullarizuar. Në çdo tabaka që shet CD-disqe kompjuterike, mund të gjeni lehtësisht më shumë se një duzinë disqesh si "Antologjia e plotë e grupit XXX" dhe poshtë këtij mbishkrimi modest - MP3. Më shpesh, për një fotografi të plotë, fraza në modë cilësia e CD-së vë në dukje kopertinat - domethënë cilësinë, si ajo e Audio-CD. Bëhet fjalë për këtë dhe jo vetëm historia jonë do të jetë më tej - për MP3-të, cilat janë ato, për cilësinë e zërit në MP3.

Rreth formatit MP3

Le të fillojmë me pak kuptim të fushës lëndore. Çfarë është ky MP3 gjithsesi?

MP3, i quajtur më saktë MPEG-1 Layer 3, është një standard i humbjes së kompresimit të audios. Në të njëjtën kohë, qëllimi kryesor në krijimin e standardit ishte sigurimi i tingullit origjinal më "identik", si dhe minimizimi i sasisë së të dhënave të ruajtura. Për këtë, u krijua një skemë origjinale e kodimit - në fazën e parë, tingulli i dixhitalizuar ndahet në përbërës të frekuencës, të cilët kalojnë nëpër një seri filtrash.

Dallimi kryesor midis MP3 dhe standardeve të mëparshme është në filtrim. Zhvilluesit e standardit kanë krijuar të ashtuquajturin model psikoakustik - një model që merr parasysh disa tipare të dëgjimit njerëzor dhe në bazë të këtij modeli, ato frekuenca filtrohen nga sinjali audio, mungesa e të cilit dëgjimi pothuajse nuk e vëren. Në fazën e dytë, rryma rezultuese kodohet duke përdorur algoritmin Huffman me një tabelë statike. Rezultati do të jetë transmetimi MP3.

Përveç kësaj, etiketat ID3 (etiketat që përmbajnë emrin e një këngë, artisti, informacione të tjera) dhe informacione të ndryshme të shërbimit gjithashtu mund të shtohen në skedarin MP3.

Modalitetet dhe bitrat e kompresimit

Gjerësia e transmetimit - Shkalla e bitit përcakton sa bit janë të nevojshme për të koduar 1 sekondë të muzikës. Standardi MP3 rregullon transmetimet nga 8kbit / s në 320kbit / s. Bit-i më tipik është 128kbit / s.

Bazuar në transmetimin, është e lehtë të llogarisni se sa do të marrë një minutë muzikë - ndani bitën me 8 (numri i bitëve për bajt) dhe shumëzoni me 60 (sekonda në minutë) - ne marrim numrin e kilobajtëve. Për transmetimin 128kbit / s tashmë të përmendur, kjo do të jetë 128/8 * 60 \u003d 960 kilobajt ose rreth një megabajt për çdo minutë të regjistrimit.

Quiteshtë mjaft e natyrshme që sa më e lartë të jetë shpejtësia e bitit, aq më shumë detaje të tingullit mund të ruhen, aq më realist tingëllon. Në zgjedhjen e bitrate kur kodoni, duhet të sakrifikoni diçka - ose cilësi në favor të madhësisë së vogël, ose madhësi në favor të cilësisë.

Modaliteti më i thjeshtë i kompresimit MP3 është Constant BitRate (CBR). Më parë, në asambletë MP3, bit-i 128 kbit / s i përmendur tashmë ishte përdorur pothuajse 100% - dhe në të njëjtën kohë mbishkrimi i cilësisë CD ishte i pranishëm në disqe. Sinqerisht, kjo është vetëm një gënjeshtër e qartë. Në praktikë, është e pamundur të dallosh tingullin e një MP3 të tillë nga tingulli i një CD audio vetëm në akustikën më të lirë.

Niveli i cilësisë në një bitrate prej 128 kbit / s është përafërsisht niveli i zërit të një regjistruesi mesatar kasetë në kasetë jo më të freskët, ndoshta pak më mirë. Ju gjithashtu mund të shtoni se është kjo shpejtësi bit që është e përhapur në regjistrimet e disponueshme në internet.

Për të thjeshtuar analizimin e bitrateve më të larta, unë do të shkruaj rrjetin e tyre: 128kbit / s, 160kbit / s, 192kbit / s, 224kbit / s, 256kbit / s, 320kbit / s. Pra, shpejtësitë e bitit prej 160 dhe 192kbit / s janë tashmë dukshëm më të mira në cilësi sesa 128kbit / s, por skedarët që rezultojnë ende nuk janë aq të mëdhenj. "Artefaktet" (defektet) e kodekut janë pothuajse të padukshme (të paktën në sistemin tim).

Unë kurrë nuk kam hasur në një bitrate prej 224 në formën e tij të pastër, kështu që nuk mund të them asgjë për cilësinë e tij, por duhet të jetë më e lartë se në shkallën e mëparshme të shkallës së bitrate. Për më tepër, unë nuk kam parë vlerësime që mbulojnë këtë bitrate. Me sa duket kjo është disi e lidhur me faktin se shpejtësia tjetër e bitit 256kbit / s njihet për sa i përket saktësisë së transmetimit të zërit, mungesës pothuajse të plotë të shtrembërimit. Në udhëzimet për kodekun Lame, kjo bit bit është emëruar edhe si Quality Studio. Dhe vetë tavani - 320kbit / s është menduar për ata që vlerësojnë më shumë cilësinë, ose për pronarët e pajisjeve me cilësi të lartë Hi-Fi apo edhe Hi-End.

Tani le të kalojmë në një çështje pak më komplekse - mënyrën e ndryshueshme të bitrate (VBR, Variable BitRate). Këtu, koncepti i bitrate është shumë i paqartë, kodekët "për përdoruesin" zakonisht përdorin vetëm kontrollin e cilësisë (si në Xing Audio Catalyst). Të tjerët (Lame) ju lejojnë të vendosni parametra shtesë - bit-et minimale dhe maksimale, përsëri cilësia.

Kur kodon VBR, vetë kodeku zgjedh bitën e dëshiruar, bazuar në parametrat e specifikuar për të, dhe gjatë fragmentit të koduar, bit-i mund të ndryshojë. Për të vlerësuar bitin e kërkuar, përdoret modeli psikoakustik i përmendur tashmë. Sidoqoftë, modeli (meqenëse nuk është i përsosur, asgjë në botën tonë nuk është perfekt) ndonjëherë tregon rezultate të pasakta. Kjo çon në një nënvlerësim, dhe, në përputhje me rrethanat, një rënie të cilësisë së tingullit në të vërtetë të dëgjueshme.

Zhvilluesit e kodikut Lame këshillojnë në këtë rast të caktojnë kufirin minimal të bitrate për të shmangur rezultate shumë të këqija. VBR gjithashtu përfshin kodimin ABR (Mesatarja e BitRate), norma mesatare e bitit. Kohët e fundit, rishikimet kanë dëgjuar vetëm përgjigje pozitive në lidhje me këtë mënyrë, veçanërisht ABR me 256 kbit / s. Kjo mënyrë funksionon në të njëjtën mënyrë si VBR, me përjashtim që kodeku t'i përmbahet pikës së përcaktuar mesatare. Për momentin unë di vetëm një kodek që ka një modalitet ABR - ky është Lame.

Përzgjedhja e kodekut

Kohët e fundit, një përdorues që dëshironte të merrte një cilësi të mirë MP3 nuk kishte një zgjedhje shumë të madhe - ky është një kodek i bazuar në ISO (bazuar në kodekun e një kodiku MP3 të lëshuar nga Organizata Ndërkombëtare e Standardeve), ose një kodik nga IIS Fraunhofer (një institut që zhvillon MP3 ) Plus kode në produktet Xing.

Pasi lexova komente të ndryshme dhe bëra një hulumtim të vogël tim, arrita në përfundimin se dega e produkteve Xing është ... është më mirë të mos i përdorësh ato. Edhe në versione relativisht të reja, të gjitha produktet e tyre që janë në gjendje të krijojnë MP3 me mjete të integruara e bëjnë atë sa më dobët që të jetë e mundur.

Ekzistojnë gjithashtu shumë punë dore "pioniere" të bëra në kodekët e vjedhur nga Xing (pothuajse të gjitha përmbajnë skedarin tompg.exe). Për një kohë të gjatë, përparësia e tyre kryesore ishte shpejtësia (në kurriz të cilësisë), por sot kodiku Lame tregon shpejtësi të krahasueshme me cilësi më të lartë. Për më tepër, produktet Xing zakonisht kushtojnë para, ndërsa Lame është falas nga përkufizimi.

Tjetra, unë do të kaloj nëpër produktet IIS Fraunhofer. Të gjithë programet e tyre falas të kompresimit MP3 janë versione të zbërthyera të produkteve të tyre komerciale. Pastaj, të gjithë kodekët e tyre nuk kanë evoluar për një kohë të gjatë dhe nuk përmbajnë mjete të reja, mbështetje për VBR / ABR, përveç kësaj, ato nuk ndryshojnë në shpejtësi të veçantë. Përdorimi i tyre i vetëm i justifikuar është kompresimi në bit me shpejtësi nën 128kbit / s - ato janë optimizuar posaçërisht për bit të ulët (megjithatë, në disa vende, në shkelje të standardit).

Kodekë të ndryshëm të bazuar në kodin ISO vuajnë në parim nga e njëjta pengesë - kompresimi me cilësi të ulët në bitrat nën 192kbit / s. Për më tepër, shumica e tyre (përfshirë BladeEnc) janë mjaft të ngadalta.

Sipas mendimit tim, kodiku Lame është opsioni më i mirë. Filluar si një kodek falas ISO, ai është rritur gjatë zhvillimit dhe tani përdoret nga të gjitha vlerësimet që krahasojnë MP3 me formatet e tjera si referencë për MP3. Pak më shumë se një vit më parë, projekti Lame më në fund shpëtoi nga kodi ISO dhe tani mund të konsiderohet një kodek plotësisht i pavarur.

Zhvillimi i codec është mjaft intensiv, ai azhurnohet vazhdimisht, gabimet rregullohen. Përveç kësaj, është e mundur të përdoret Lame jo vetëm nën Windows, por edhe nën sisteme të ndryshme Unix, ai gjithashtu punon në DOS të pastër. Përsëri, kodi burim plotësisht falas është i disponueshëm (për ata që duan të gërmojnë në të), ato të përpiluara tashmë janë në dispozicion nga disa site skedare binare (.exe dhe.dll), i optimizuar për procesorë të ndryshëm.

Ekziston edhe një version pak i zhveshur i Lame - kodifikuesi GOGO-no-coda, i cili tregon rezultate fantastike në shpejtësi (dy herë më shpejt se Lame tashmë i shpejtë).

Pra, cilën bitrate dhe cilën mënyrë duhet të përdorni?

Duke marrë parasysh të gjitha sa më sipër, unë do të rekomandoja arkivimin e MP3 me 320Kbit / s, modalitetin CBR, ose 256kbit / s, ABR. E para, për mendimin tim, është disi e preferueshme, tk. ju merrni cilësinë më të lartë të disponueshme brenda formatit. Për regjistrimet "dëgjoni dhe fshini" është e arsyeshme të përdorni ABR 192kbit / s.

Dhe një gjë më shumë - është më mirë të mos përdorni bitrate nën 192 kbit / s për ndonjë ruajtje të gjatë - përveç nëse regjistrimi me të cilin është bërë MP3 është gjithmonë në majë të gishtave tuaj (edhe pse mos harroni se regjistrimi analog në një shirit magnetik degradon me kalimin e kohës) ...

Shumë shpesh argumenti që unë dëgjoj në favor të bitrateve të ulëta dhe kompresimit "të shtrembër" është "Unë kam akustikë të keqe dhe ende nuk mund ta dëgjoj ndryshimin". Gjithçka mund të ndryshojë, ose duhet të përdorni arkivin tuaj në pajisje të përshtatshme dhe nuk do të jeni në gjendje të arrini në regjistrimin origjinal. Përgjigja nuk është aspak e largët, unë mund të përmend një rast nga praktika ime.

Në qytetin tonë Pavlovo dikur ishte një klub i vogël ku muzika luhej nga një kompjuter (MP3 me një bit bit jo më të lartë se 160kbit / s). Pastaj klubi vdiq i lumtur dhe kompjuteri me arkivat muzikore u zhvendos në një kompani tjetër që merrej me mbajtjen e ngjarjeve publike. Imagjinoni që ata të vendosin të luajnë këtë muzikë në fund të qytetit! Tmerri kur, në akustikë pak a shumë të denjë, mund të dëgjoheshin të gjitha defektet e futura nga paketimi me një shpejtësi kaq të vogël. Tingulli ishte më i keq sesa nga regjistruesi i tyre i veshur mirë i kasetave me kaseta gjysmë të përtypura. Do të ishte e mençur të shmangim përsëritjen e gabimeve të njerëzve të tjerë, apo jo?

Testoni harduerin dhe softuerin

Kompjuter: Athlon TB 650MHz, M / B Acorp 7KTA 100MHz FSB, 128 MB RAM PC-133, HDD Quantum 40Gb 5400rpm, SoundBlaster 16 Vibra, kodek AC97.
Sistemi audio: amplifikatori Radiotehnika U-7111, palë altoparlantësh Radiotehnika S-90B.
Softueri: OS Windows98 SE, Winamp 2.75, Eac 0.9pb11, Lame 3.90a, GOGO-no-coda 3.07a

Shkalla e bitit tregohet si një nga karakteristikat kryesore të regjistrimeve video dhe audio. Shumica e përdoruesve janë mësuar të mendojnë se kjo përcakton cilësinë e skedarit të shkarkuar. Por çfarë janë bitrat dhe si i karakterizojnë ato në të vërtetë skedarët dhe videot muzikore? Le ta shohim më nga afër këtë.
Çfarë janë bitrat?
Shkalla e bitit është një vlerë që tregon numrin e njësive të informacionit (megabit ose kilobit) që përshtaten në një sekondë të riprodhimit të skedarit. Prandaj, matet në megabit për sekondë (Mbps) ose kilobit për sekondë (Kbps). Përndryshe, shpejtësia e bitit mund të përshkruhet si gjerësia e brezit. Kjo karakteristikë është e rëndësishme për ata që duan të konvertojnë skedarët, sepse për të njëjtën kohëzgjatje, një bit bit më i lartë do të rrisë madhësinë e skedarit. Përveç madhësisë, cilësia e zërit gjithashtu ndryshon. Ulja e madhësisë gjatë uljes së bitit quhet kompresim.
Një skedar i zakonshëm muzikor është një skedar audio i kompresuar në një masë të tillë që një disk standard mund të mbajë deri në 12 orë muzikë. Në të njëjtën kohë, cilësia mbetet mjaft e lartë për shkak të kompresimit psikoakustik: tingujt me ato frekuenca dhe nivelet e vëllimit që nuk kapen nga veshi i njeriut hiqen nga i gjithë diapazoni. Tingujt e zgjedhur formohen në blloqe diskrete të quajtura korniza. Kornizat kanë të njëjtën kohëzgjatje dhe janë të ngjeshura sipas algoritmit të specifikuar. Kur luhet muzikë, sinjali rikrijohet nga blloqet e dekoduara në sekuencë.
Cila është kompresimi i përdorur zakonisht?
Bit-i audio është më së shpeshti 256 Kbps. Me këtë vlerë, regjistrimi audio është i ngjeshur me madhësi afërsisht 6 herë, kështu që 6 herë më shumë muzikë mund të regjistrohet në një disk sesa para ngjeshjes. Nëse bit-i ulet në 128 Kbps, atëherë një disk do të përshtatet 12 herë më shumë muzikë, por cilësia e zërit do të jetë dukshëm më e ulët. Muzika e regjistruar në 128 Kbps ofrohet më shpesh për të dëgjuar në Internet, pasi pronarët e burimeve bëjnë ndonjë sakrificë në ndjekje të rritjes së shpejtësisë së ngarkimit të faqes. Shumë përdorues vërejnë se cilësia e tij nuk është aspak ideale.
Tani që është bërë e qartë se çfarë janë bit-et, është koha për të përcaktuar nivelin optimal të tyre. Amatorët dhe profesionistët ashtu argumentojnë pafund se si bitrate ndikon në cilësinë e zërit, dhe nëse ndikon. Në albumet muzikore, si rregull, tregohet shpejtësia e bitit. I njëjti disk, i regjistruar në 128 Kbps dhe 256 Kbps, do të ndryshojë në çmim përgjysmë.
Bitrate optimale për kushte të ndryshme dëgjimi
Për shumë njerëz, dymbëdhjetë herë kompresimi nuk paraqet ndonjë dëm, ndërsa të tjerët argumentojnë se ata nuk mund të dëgjojnë muzikë me shpejtësi pak më të ulët se 320 Kbps. Në mënyrë paradoksale, të dy kanë të drejtë. Fakti është që në fund të fundit cilësia e riprodhimit nuk varet nga, por nga kushtet e riprodhimit, madje edhe nga lloji i muzikës.
Për shembull, një këngë luhet në një magnetofon të instaluar në një makinë shtëpiake. Në këtë rast, cilësia në nivelin 192 Kbps do të jetë mjaft e mjaftueshme. Një bit i lartë do të përmirësojë cilësinë e zërit, por ndryshimi nuk do të vërehet për shkak të nivelit të lartë të zhurmës gjatë udhëtimit. Nëse muzika luhet në një kompjuter në shtëpi ose në një luajtës portabël, atëherë kërkohen të paktën 256 Kbps. Nëse sinjali nuk pëson ndryshime, transmetohet në pajisje të jashtme dhe del në altoparlantë të shtrenjtë të importuar, atëherë duhet të përdorni kompresimin minimal nëse është e mundur. Shtë e mundur në një bitrate prej 320 Kbps.
Bitrate optimale për stile të ndryshme muzikore
Muzika me bit të lartë nuk është gjithmonë e nevojshme. Muzika popullore zakonisht tingëllon mjaft mirë me 192-256 Kbps. Mund të vendoset cilësi më e lartë, por nuk ka asnjë kuptim në këtë: këngët pop janë jetëshkurtra, kështu që kursimi i hapësirës në disk duhet të jetë një përparësi. Përveç kësaj, cilësia e regjistrimeve origjinale është gjithashtu mesatare, kështu që rritja e bit-it mund të mos ndikojë në cilësinë e skedarit të luajtur në asnjë mënyrë. Për të dëgjuar në transport dhe në festa joformale, cilësia mesatare është mjaft e mjaftueshme.
Nëse po flasim për muzikë klasike, vepra të grupeve legjendare të rokut ose këngë të rralla të autorëve, atëherë cilësia duhet të jetë mbi të gjitha. Kur blini një muzikë të tillë, duhet të shikoni shpejtësinë e bitit të treguar në paketimin e diskut. Nëse kënga është shkarkuar nga interneti, atëherë një informacion i tillë duhet të jetë i pranishëm në faqen e shkarkimit. Për më tepër, shpejtësia e bitit shfaqet në riprodhues gjatë riprodhimit.
Bitrates e skedarit video
U tha më sipër se cilat janë bitrat e regjistrimeve audio. Por çfarë është bitrate video? Duke qenë se videoja luhet si një sekuencë tingujsh dhe imazhesh, përkufizimi i bitrate do të jetë i njëjtë. Prania e filmimeve e bën skedarin më të rëndë, por në fund të fundit imazhet për procesorin janë të njëjtat zero dhe ato si tingujt. Parimi i kriptimit të informacionit është i njëjtë për të gjitha llojet e skedarëve.

Debunking mitet e njohura në lidhje me audio dixhitale.

2017-10-01T15: 27

2017-10-01T15: 27

Softueri Audiophile

shënim: Për një kuptim më të mirë të tekstit më poshtë, ju rekomandoj shumë që të familjarizoheni me bazat e audios dixhitale.
Gjithashtu, shumë nga pikat e diskutuara më poshtë janë theksuar në botimin tim "Edhe një herë në lidhje me të vërtetën e trishtuar: nga vjen me të vërtetë tingulli i mirë?" ...

Sa më i lartë bit-i, aq më e mirë është pista

Kjo nuk është gjithmonë rasti. Së pari, më lejoni t'ju kujtoj se çfarë është bitrey t (bitrate, jo bitraid). Në fakt, kjo është shkalla e të dhënave në kilobit për sekondë gjatë riprodhimit. Kjo është, nëse marrim madhësinë e pistës në kilobit dhe ndajmë me kohëzgjatjen e saj në sekonda, ne marrim bitrat e tij - të ashtuquajturën. bitrate e bazuar në skedar (FBR), zakonisht nuk ndryshon shumë nga bit-i i rrjedhës audio (arsyeja e ndryshimeve është prania e meta të dhënave në titull - etiketat, imazhet "e ngulitura", etj.).
Tani le të marrim një shembull: bit-i i audios PCM të pakompresuar të regjistruar në një CD të rregullt Audio llogaritet si më poshtë: 2 (kanale) × 16 (bit për shembull) × 44100 (mostra për sekondë) \u003d 1411200 (bps) \u003d 1411.2 kbps ... Tani le të marrim dhe kompresojmë rrugën me çdo kodek pa humbje ("pa humbje" - "pa humbje", domethënë, një që nuk çon në humbjen e ndonjë informacioni), për shembull, kodekin FLAC. Si rezultat, ne do të kemi një bitrate më të ulët se ai origjinal, por cilësia do të mbetet e pandryshuar - këtu është përgënjeshtrimi juaj i parë.

Diçka tjetër ia vlen të shtohet këtu. Bit-i i daljes me kompresim pa humbje mund të jetë shumë i ndryshëm (por, si rregull, është më pak se ai i audios së pakompresuar) - varet nga kompleksiteti i sinjalit të kompresuar, ose më mirë nga teprica e të dhënave. Kështu, sinjalet më të thjeshta do të ngjeshen më mirë (d.m.th. kemi një madhësi më të vogël skedari për të njëjtën kohëzgjatje \u003d\u003e shpejtësi më të ulët bit), dhe sinjalet më komplekse do të jenë më keq. Kjo është arsyeja pse muzika klasike pa humbje ka një shpejtësi më të ulët se, të themi, rock. Por duhet theksuar që shpejtësia e bit-it këtu nuk është aspak tregues i cilësisë së materialit zanor.

Tani le të flasim për kompresimin me humbje (humbje). Para së gjithash, duhet të kuptoni se ka shumë enkodues dhe formate të ndryshme, madje edhe brenda të njëjtit format, cilësia e kodimit për enkodues të ndryshëm mund të ndryshojë (për shembull, QuickTime AAC kodon shumë më mirë sesa FAAC të vjetëruar), për të mos përmendur epërsinë e formateve moderne (OGG Vorbis, AAC , Opus) mbi MP3. Ta themi thjesht, nga dy këngë identike të koduara nga enkodues të ndryshëm me të njëjtën bitrate, disa do të tingëllojnë më mirë dhe disa do të tingëllojnë më keq.

Përveç kësaj, ekziston një koncept i tillë si kthyeshëm... Kjo është, ju mund të merrni një titull në format MP3 me një bitrate prej 96 kbps dhe ta ktheni atë në MP3 320 kbps. Jo vetëm që cilësia nuk do të përmirësohet (në fund të fundit, të dhënat e humbura gjatë kodimit të mëparshëm 96 kbit / s nuk mund të kthehen), madje do të përkeqësohen. Vlen të theksohet se në secilën fazë të kodifikimit me humbje (me çdo shpejtësi bit dhe çdo kodues), një sasi e caktuar e shtrembërimit futet në audio.

Dhe akoma më shumë. Ekziston edhe një nuancë tjetër. Nëse, të themi, bit-i i një transmetimi audio është 320 kbps, kjo nuk do të thotë që të gjitha 320 kbps janë shpenzuar për kodimin atë sekondë. Kjo është tipike për kodimin e vazhdueshëm të bit-it dhe për ato raste kur një person, duke shpresuar për një cilësi maksimale, detyron një bit-të konstante shumë të lartë (për shembull, duke vendosur 512 kbps CBR për Nero AAC). Siç e dini, numri i bitëve të alokuar në një kornizë të caktuar rregullohet nga modeli psikoakustik. Por në rastin kur shuma e alokuar është shumë më e ulët se bit-i i caktuar, atëherë edhe rezervuari i bitëve nuk kursen (për termat, shih artikullin "Çfarë është CBR, ABR, VBR?") - si rezultat, ne marrim "zero bit" të padobishme që thjesht "përfundojnë" »Madhësia e kornizës në atë të kërkuar (p.sh., rritni madhësinë e rrymës në atë të specifikuar). Nga rruga, kjo është e lehtë për t'u kontrolluar - ngjesh skedarin që rezulton me një arkivues (mundësisht 7z) dhe shikoni në raportin e ngjeshjes - sa më shumë që është, aq më shumë zero zero (pasi ato çojnë në tepricë), aq më shumë hapësirë \u200b\u200be humbur.

Kodekët me humbje (MP3 dhe të tjerët) janë në gjendje të përballen me muzikën moderne elektronike, por nuk janë në gjendje të kodifikojnë në mënyrë efikase muzikën klasike (akademike), të drejtpërdrejtë, instrumentale

"Ironia e fatit" këtu është se në fakt gjithçka është saktësisht e kundërta. Siç e dini, muzika akademike në shumicën dërrmuese të rasteve ndjek parimet melodike dhe harmonike, si dhe përbërjen instrumentale. Nga pikëpamja matematikore, kjo çon në një përbërje relativisht të thjeshtë harmonike të muzikës. Pra, mbizotërimi i bashkëtingëlloreve prodhon më pak harmonikë anësore: për shembull, për një të pestën (intervali në të cilin frekuencat themelore të dy tingujve ndryshojnë me një herë e gjysmë), çdo harmonikë e dytë do të jetë e zakonshme për dy tinguj, për një të katërtin, ku frekuencat ndryshojnë me një të tretën - çdo të tretën dhe etj. Përveç kësaj, prania e raporteve fikse të frekuencës, për shkak të përdorimit të temperamentit të barabartë, thjeshton gjithashtu përbërjen spektrale të muzikës klasike. Përbërja instrumentale e drejtpërdrejtë e klasikëve përcakton mungesën e zhurmave karakteristike të muzikës elektronike, shtrembërimet, kërcimet e mprehta në amplitudë, si dhe mungesën e një tepricë të përbërësve me frekuencë të lartë.

Faktorët e renditur më sipër çojnë në faktin se muzika klasike është shumë më e lehtë për tu kompresuar, kryesisht thjesht matematikisht. Nëse e mbani mend, kompresimi matematik funksionon duke eliminuar tepricën (duke përshkruar informacione të ngjashme duke përdorur më pak bit), dhe gjithashtu duke parashikuar (të ashtuquajturat. parashikuesit parashikojnë sjelljen e sinjalit, dhe pastaj vetëm devijimi i sinjalit real nga ai i parashikuar është i koduar - sa më saktë që përputhen, aq më pak bit janë të nevojshme për kodimin). Në këtë rast, një përbërje relativisht e thjeshtë spektrale dhe harmonizmi çojnë në tepricë të lartë, eleminimi i së cilës jep një shkallë të konsiderueshme të kompresimit dhe një numër i vogël shpërthimesh dhe përbërësish zhurme (të cilat janë sinjale të rastësishme dhe të paparashikueshme) çon në parashikueshmëri të mirë matematikore të shumicës dërrmuese të informacionit. Dhe kjo nuk do të përmendë vëllimin mesatar relativisht të ulët të pjesëve klasike dhe intervalet e shpeshta të heshtjes, për kodimin e të cilave informacioni praktikisht nuk kërkohet. Si rezultat, ne mund të kompresojmë pa humbje, për shembull, disa muzikë solo instrumentale në shpejtësi bit nën 320 kbps (koduesit TAK dhe OFR janë mjaft të aftë për këtë).

Së pari, fakti është se kompresimi matematikor që qëndron në kodifikimin pa humbje është gjithashtu një nga fazat e kodimit me humbje (lexo Kuptoni rreth kodimit MP3). Dhe së dyti, meqenëse humbja përdor transformimin Fourier (zbërthimi i sinjalit në harmonikë), thjeshtësia e përbërjes spektrale madje e bën punën e koduesit dyfish më të lehtë. Si rezultat, duke krahasuar modelin origjinal dhe të koduar të muzikës klasike në një provë të verbër, ne befasohemi kur zbulojmë se nuk mund të gjejmë ndonjë ndryshim, madje edhe në një bitrate relativisht të ulët. Dhe gjëja qesharake është se kur fillojmë të ulim plotësisht bit-in e kodimit, gjëja e parë që zbulon ndryshimin është zhurma e sfondit në regjistrim.

Sa i përket muzikës elektronike, koduesit e kanë shumë të vështirë: komponentët e zhurmës kanë një tepricë minimale, dhe së bashku me kërcimet e mprehta (disa impulse dhëmbësh) janë sinjale jashtëzakonisht të paparashikueshme (për koduesit që janë "mprehur" për tinguj natyralë që sillen plotësisht përndryshe), transformimi i drejtpërdrejtë dhe i anasjelltë i Furierit me refuzimin e harmonikave individualë nga modeli psikoakustik jep në mënyrë të pashmangshme efekte para dhe pas eko, dëgjueshmëria e të cilave nuk është gjithmonë e lehtë për t'u vlerësuar nga koduesi ... Shtoni kësaj një nivel të lartë të përbërësve HF - dhe ju merrni një numër të madh të vrasësit - shembuj me të cilët edhe enkoduesit më të përparuar nuk mund të përballen me bitrate mesatare të ulët, çuditërisht është mes muzikës elektronike.

Gjithashtu zbavitës janë mendimet e "dëgjuesve me përvojë" dhe muzikantëve, të cilët, me një keqkuptim të plotë të parimeve të kodimit me humbje, fillojnë të pohojnë se dëgjojnë sesi instrumentet në muzikë, pas kodimit, fillojnë të falsifikohen, frekuencat notojnë, etj. Kjo, ndoshta, do të ishte akoma e vërtetë për antediluvin lexuesit e kasetave me detonim, por në audio dixhitale gjithçka është e saktë: përbërësi i frekuencës ose mbetet ose hidhet, thjesht nuk ka nevojë të zhvendoset tonaliteti. Për më tepër: veshi i një personi për muzikë nuk do të thotë aspak se ai ka dëgjim të mirë me frekuencë (për shembull, aftësia për të perceptuar frekuencat\u003e 16 kHz, e cila zvogëlohet me moshën) dhe nuk e bën më të lehtë për të që të kërkojë artefakte të humbura të kodimit, që nga shtrembërimi këto kanë një karakter shumë specifik dhe kërkojnë përvojën e krahasimit të verbër, përkatësisht audio me humbje - duhet të dini se çfarë dhe ku të kërkoni.

DVD-Audio tingëllon më mirë se Audio CD (24 bit kundrejt 16, 96 kHz kundrejt 44.1, etj.)

Fatkeqësisht, njerëzit zakonisht shikojnë vetëm numra dhe shumë rrallë mendojnë për ndikimin e një parametri ose një tjetri në cilësinë objektive.

Le të shqyrtojmë së pari thellësinë e bitit. Ky parametër nuk është përgjegjës për asgjë më shumë sesa diapazoni dinamik, d.m.th., ndryshimi midis tingujve më të qetë dhe më të lartë (në dB). Në audio dixhitale, niveli maksimal është 0 dBFS (FS - shkallë e plotë), dhe minimumi është i kufizuar nga niveli i zhurmës, domethënë, në fakt, diapazoni dinamik në vlerë absolute është i barabartë me nivelin e zhurmës. Për audio 16-bitëshe, diapazoni dinamik llogaritet si 20 × log 10 2 16, që është i barabartë me 96,33 wB. Diapazoni dinamik i orkestrës simfonike është deri në 75 dB (kryesisht rreth 40-50 dB).

Tani le të imagjinojmë kushtet reale. Niveli i zhurmës në dhomë është rreth 40 dB (mos harroni se dB është një vlerë relative. Në këtë rast, pragu i dëgjimit merret si 0 dB), vëllimi maksimal i muzikës arrin 110 dB (në mënyrë që të mos ketë shqetësime) - ne marrim një ndryshim prej 70 dB. Kështu, rezulton se një diapazon dinamik prej më shumë se 70 dB në këtë rast është thjesht i padobishëm. Kjo do të thotë, në një diapazon më të lartë, ose tingujt e zhurmshëm do të arrijnë pragun e dhimbjes, ose tingujt e qetë do të përthithen nga zhurma përreth. Veryshtë shumë e vështirë të arrihet një nivel i zhurmës së ambientit më pak se 15 dB (meqenëse zëri i frymëmarrjes njerëzore dhe zhurmat e tjera të shkaktuara nga fiziologjia njerëzore është në këtë nivel), si rezultat, një interval prej 95 dB për të dëgjuar muzikë është plotësisht i mjaftueshëm.
Tani në lidhje me shkallën e kampionimit (shkalla e marrjes së mostrës, shkalla e mostrës). Ky parametër është përgjegjës për shpejtësinë e marrjes së mostrës në kohë dhe ndikon drejtpërdrejt në frekuencën maksimale të sinjalit që mund të përshkruhet nga kjo paraqitje audio. Sipas teoremës së Kotelnikov, është e barabartë me gjysmën e normës së marrjes së mostrave. Kjo është, për një frekuencë normale të marrjes së mostrave prej 44100 Hz, frekuenca maksimale e përbërësve të sinjalit është 22050 Hz. Frekuenca maksimale. e cila perceptohet nga veshi i njeriut - pak më shumë se 20,000 Hz (dhe madje edhe atëherë, në lindje; ndërsa plakemi, pragu bie në 16,000 Hz).

Kjo temë trajtohet më së miri në artikullin Shkarkime 24/192 - Pse nuk bëjnë kuptim.

Lojtarët e ndryshëm të programeve tingëllojnë ndryshe (p.sh. foobar2000 është më i mirë se Winamp, etj.)

Për të kuptuar pse nuk është kështu, duhet të kuptoni se çfarë është një lojtar softuerësh. Në fakt, ky është një dekodues, mbajtës (opsional), një shtojcë dalëse (në njërën nga ndërfaqet: ASIO, DirectSound, WASAPI etj.), Dhe natyrisht GUI (ndërfaqja grafike e përdoruesit). Meqenëse dekoduesi në 99.9% të rasteve punon sipas algoritmit standard, dhe plug-in e daljes është vetëm një pjesë e programit që transmeton një transmetim në kartën e zërit përmes njërës prej ndërfaqeve, arsyeja e ndryshimeve mund të jenë vetëm mbajtësit. Por fakti është që mbajtësit zakonisht janë me aftësi të kufizuara (ose duhet të çaktivizohen, pasi gjëja kryesore për një lojtar të mirë është të jetë në gjendje të transmetojë tinguj në formën e tij "origjinale"). Si rezultat, tema e krahasimit këtu mund të jetë vetëm aftësive përpunimi dhe prodhimi, i cili, nga rruga, është shumë shpesh i panevojshëm. Por edhe nëse ekziston një nevojë e tillë, atëherë ky është tashmë një krahasim i mbajtësve, jo i lojtarëve.

Versione të ndryshme të shoferit tingëllojnë ndryshe

Kjo deklaratë bazohet në një injorancë banale të parimeve të funksionimit të kartës së zërit. Shoferi është softuerkërkohet për ndërveprim efektiv të pajisjes me sistemi operativ, e cila gjithashtu zakonisht siguron një ndërfaqe grafike përdorimi për menaxhimin e pajisjes, parametrat e saj, etj. Drejtuesi i kartës së zërit siguron që karta e zërit të njihet si një pajisje e shëndoshë e Windows, informon OS për formatet e mbështetura nga karta dhe siguron një rrjedhë PCM të pakompresuar (në shumicën e rasteve) në kartelë , dhe gjithashtu jep qasje në cilësimet. Përveç kësaj, në rastin e përpunimit të softuerit (me anë të CPU-së), shoferi mund të përmbajë DSP të ndryshme (mbajtës). Prandaj, së pari, me efekte të paafta dhe përpunim, nëse shoferi nuk siguron transferimin e saktë të PCM në kartë, ky konsiderohet një gabim i rëndë, një gabim kritik. Dhe kjo ndodh rrallë... Nga ana tjetër, ndryshimet midis drejtuesve mund të jenë në azhurnimin e algoritmeve të përpunimit (rishikuesit, efektet), megjithëse kjo gjithashtu nuk ndodh shpesh. Përveç kësaj, efektet dhe çdo përpunim i drejtuesit duhet të lihen ende për të arritur cilësinë më të lartë.

Kështu, azhurnimet e drejtuesve janë përqendruar kryesisht në përmirësimin e stabilitetit dhe rregullimin e gabimeve të trajtimit. Në rastin tonë, as njëra dhe as tjetra nuk ndikojnë në cilësinë e riprodhimit, prandaj në 999 raste nga 1000 shoferi nuk ndikon në tingull.

CD-të e licencuara Audio tingëllojnë më mirë se kopjet e tyre

Nëse gjatë kopjimit nuk ka pasur gabime (fatale) të leximit / shkrimit dhe disku optik i pajisjes në të cilën do të luhet kopja nuk ka probleme me leximin e saj, atëherë një deklaratë e tillë është e gabuar dhe lehtë hidhet poshtë.

Modaliteti i kodimit stereo jep cilësi më të mirë se stereoja e përbashkët

Ky keqkuptim ka të bëjë kryesisht me LAME MP3, pasi përdorin të gjithë koduesit modernë (AAC, Vorbis, Musepack) vetëm Modaliteti i përbashkët stereo (dhe kjo tashmë po flet për diçka)

Për fillestarët, vlen të përmendet se modaliteti i përbashkët stereo përdoret me sukses me kompresim pa humbje. Thelbi i tij qëndron në faktin se sinjali para kodimit zbërthehet në shumën e kanaleve të djathtë dhe të majtë (Mid) dhe ndryshimin e tyre (Ana), dhe pastaj këto sinjale kodohen veçmas. Në kufi (për të njëjtin informacion në kanalin e djathtë dhe të majtë), merren kursime të dyfishta të të dhënave. Dhe meqenëse në shumicën e muzikës informacioni në kanalet e djathtë dhe të majtë është mjaft i ngjashëm, kjo metodë është shumë efektive dhe ju lejon të rrisni ndjeshëm raportin e kompresimit.

Në humbje, parimi është i njëjtë. Por këtu, në modalitetin e bitrateve konstante, cilësia e fragmenteve me informacion të ngjashëm në dy kanale do të rritet (në kufi, ajo do të dyfishohet), dhe për mënyrën VBR në vende të tilla, bitrate thjesht do të ulet (mos harroni se detyra kryesore e modalitetit VBR është të ruajë në mënyrë të qëndrueshme cilësinë e specifikuar të kodimit, duke përdorur bit-in më të ulët të mundshëm). Meqenëse gjatë kodimit me humbje, përparësia (në caktimin e bitëve) i jepet shumës së kanaleve për të shmangur degradimin e panoramës stereo, përdoret kalimi dinamik midis mënyrave stereo të kornizës së përbashkët (Mid / Side) dhe normale (Left / Right). Nga rruga, arsyeja për këtë mashtrim ishte papërsosmëria e algoritmit të kalimit në versionet e vjetra të LAME, si dhe prania e modalitetit të Forcës së Përbashkët, në të cilën nuk ka ndërrim automatik. NË versionet e fundit Modaliteti LAME Joint është aktivizuar si parazgjedhje dhe nuk rekomandohet të ndryshohet.

Sa më i gjerë të jetë spektri, aq më i mirë është regjistrimi (rreth spektrogramëve, auCDtect dhe intervalit të frekuencës)

Në ditët e sotme në forume, për fat të keq, është shumë e zakonshme të matësh cilësinë e një piste me një "vizore në spektrogram". Padyshim, për shkak të thjeshtësisë së kësaj metode. Por, siç tregon praktika, në realitet gjithçka është shumë më e komplikuar.

Dhe çështja është kjo. Spektrogrami demonstron vizualisht shpërndarjen e fuqisë së sinjalit mbi frekuencat, por nuk mund të japë një pamje të plotë të tingullit të regjistrimit, pranisë së shtrembërimeve dhe artefakteve të kompresimit në të. Kjo është, në fakt, gjithçka që mund të përcaktohet nga spektrogrami është diapazoni i frekuencës (dhe pjesërisht - dendësia e spektrit në rajonin HF). Kjo është, në rastin më të mirë, duke analizuar spektrogramin, mund të identifikoni kthyesin. Krahasimi i spektrogramëve të pjesëve të marra nga kodimi nga enkodues të ndryshëm me origjinalin është një absurditet i dukshëm. Po, ju mund të identifikoni ndryshimet në spektër, por përcaktimi nëse ato do të perceptohen (dhe në çfarë mase) nga veshi i njeriut është pothuajse e pamundur. Ne nuk duhet të harrojmë se detyra e kodimit me humbje është të sigurojë një rezultat të padallueshëm veshi i njeriut nga origjinali (jo me sy).

E njëjta gjë vlen për vlerësimin e cilësisë së kodimit duke analizuar gjurmët e daljes me programin auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect janë thjesht predha për programin e konzolës auCDtect të një lloji). Algoritmi auCDtect gjithashtu në fakt analizon diapazonin e frekuencës dhe vetëm ju lejon të përcaktoni (me një shkallë të caktuar të probabilitetit) nëse compression MPEG është aplikuar në ndonjë nga fazat e kodimit. Algoritmi është përshtatur për MP3, kështu që është e lehtë të "mashtrosh" duke përdorur kodekët Vorbis, AAC dhe Musepack, kështu që edhe nëse programi shkruan "100% CDDA" nuk do të thotë që audio e koduar është 100% identike me atë origjinale.

Dhe kthimi direkt në spektra. Gjithashtu e njohur është dëshira e disa "entuziastëve" për të fikur me të gjitha mënyrat filtrin e kalimit të ulët në koduesin LAME. Ekziston një mungesë e të kuptuarit të parimeve të kodimit dhe psikoakustikës. Së pari, kodifikuesi shkurton frekuencat e larta vetëm për një qëllim - të ruajë të dhëna dhe t'i përdorë ato për të kodifikuar intervalin më të dëgjueshëm të frekuencës. Diapazoni i zgjeruar i frekuencës mund të ketë një efekt fatal në cilësinë e përgjithshme të zërit dhe të çojë në objekte të kodimit të dëgjueshëm. Për më tepër, fikja e ndërprerjes në 20 kHz është përgjithësisht plotësisht e pajustifikuar, pasi një person thjesht nuk dëgjon frekuencat më lart.

Ekziston një lloj i paravendosur EQ "magjik" që mund të përmirësojë ndjeshëm tingullin

Kjo nuk është plotësisht e vërtetë, së pari, sepse secili konfigurim i marrë veçmas (kufje, akustikë, kartë zanore) ka parametrat e vet (në veçanti, karakteristikën e tij të frekuencës së amplitudës). Prandaj, çdo konfigurim duhet të ketë qasjen e vet, unike. Ta themi thjesht, ekziston një paravendosje e tillë e EQ, por është e ndryshme për konfigurime të ndryshme. Thelbi i tij qëndron në rregullimin e përgjigjes së frekuencës së shtegut, domethënë, në "nivelimin" e zhytjeve dhe valëve të padëshiruara.

Gjithashtu, midis njerëzve larg punës direkte me zë, vendosja e barazuesit grafik "me një tik-tak" është shumë e popullarizuar, e cila në fakt përfaqëson një rritje në nivelin e komponentëve të frekuencës së ulët dhe të lartë, por në të njëjtën kohë çon në mbytje të vokaleve dhe instrumenteve, spektri i zërit i të cilave është në rajonin e mesit

Para se ta shndërroni muzikën në një format tjetër, duhet ta "dekompresoni" në WAV

Shënoj menjëherë se WAV nënkupton të dhëna PCM (modulim i kodit të pulsit) në një kontejner WAVE (skedar me shtrirje * .wav). Këto të dhëna nuk janë asgjë më shumë se një sekuencë bitësh (zero dhe njësi) në grupe prej 16, 24 ose 32 (në varësi të thellësisë së bitit), secila prej të cilave është një kod binar i amplitudës së mostrës përkatëse (për shembull, për 16 bit në shënim dhjetor këto janë vlera nga -32768 në +32768).

Pra, fakti është që çdo përpunues i zërit - qoftë filtër apo kodues - zakonisht funksionon vetëm me këto vlera, dmth vetëm me të dhëna të pakompresuara. Kjo do të thotë që për të kthyer audio nga, të themi, FLAC në APE, thjesht e nevojshme deshifroj FLAC në PCM së pari dhe pastaj kodoj PCM në APE. Likeshtë si të ripaketosh skedarët nga ZIP në RAR, së pari duhet të shpaketosh ZIP.

Sidoqoftë, nëse jeni duke përdorur një konvertues ose thjesht një kodues të avancuar të konsolës, shndërrimi i ndërmjetëm në PCM ndodh menjëherë, ndonjëherë edhe pa shkruar në një skedar të përkohshëm WAV. Kjo është ajo që i mashtron njerëzit: duket se formatet konvertohen drejtpërdrejt te njëri-tjetri, por në fakt një program i tillë duhet të ketë një dekodues të formatit hyrës që kryen një shndërrim të ndërmjetëm në PCM.

Kështu, shndërrimi manual në WAV nuk do t'ju japë absolutisht asgjë përveç humbjes së kohës.

pikëpamjet

Ruaj në Odnoklassniki Ruaj VKontakte

1. Instaloni programin për të ndryshuar bitrate

2. Shtoni skedarë në program

3. Zgjidhni formatin e ruajtjes

4. Vendosni vlerën e dëshiruar të bitrate

Specifikimet