Kako napisati 1000 tonova u 1 s wav formatu??

[ NemanjaCSHARP @ 24.07.2008. 19:41 ] @

Da li postoji nachin da se zapishe 1000 tonova u jednoj secundi u wav fajlu tj u svakoj milisecundi drugi ton???

[ jablan @ 24.07.2008. 20:20 ] @

Što ne bi postojao?

[ mmix @ 24.07.2008. 20:41 ] @

Na 44.1Khz sampling rate je relativno moguce ali ne vidim svrhu
To ostavlja 44 sample-a po tonu, sto daje minimalnu frekvenciju jednog tona od 1Khz (za jednu punu amplitudu), 2Khz (za min 2 amplitude), itd maksimalnu 22Khz, u principu mozes da seces amplitude, ali ti ovde igru igra i "tromost" i definicija zvucnika a i cinjenica da covek retko cuje preko nekih 18, 19kHz, ako neko uopste bude u stanju da razluci 1000 promena u sekundi. A i sto vise ides ka gornjim frekvencijama, manje semplova po amplitudi znaci ograniceniji oblik amplitude, pa je i diskutabilno da li bi mogao da generises 1000 razlicitih amplituda u 44 sempla, bar u smislu da budu razliciti tonovo. Iskreno ne kontam cemu bi ti to sluzilo.

[ jablan @ 24.07.2008. 20:57 ] @

Čovek nije rekao da treba da bude 1000 različitih tonova. ;)

[ masetrt @ 24.07.2008. 21:06 ] @

Ovde mozes downloadovati specifikaciju wav (i mnogih drugih formata)
http://www.wotsit.org/list.asp...&fc=12&search=&al=

Pitanje koliko kanala i kako ih zelis upotrebiti

Citat:

Iskreno ne kontam cemu bi ti to sluzilo

Pa na primer komunikacija sa nekim analognim uredjajem, ili komunikacija sa digitalnim uredjajem putem analogne veze (secate se and shake-a modema, ili ucitavanja igara na spektrumu)

[ mmix @ 24.07.2008. 21:42 ] @

Citat:

masetrt: Pa na primer komunikacija sa nekim analognim uredjajem, ili komunikacija sa digitalnim uredjajem putem analogne veze (secate se and shake-a modema, ili ucitavanja igara na spektrumu)

Babe i zabe. To sto pominjes su primeri analogne modulacije digitalnog signala u kome se promenama osnovnog carrier analognog signala (to je onaj monotoni jednolicni zvuk koji cujes tokom handshake-a i na spektrum/commodore kasetama) kodira digitalni sadrzaj. Pustanje wav fajla na zvucnike nije modulacije vec digitalno analogna konverzija (DAC) i ista se tesko moze koristiti za komunikaciju uredjaja jer je veoma tesko postici sinhronizaciju izmedju dva razlicita uredjaja (cemu upravo sluzi carrier signal), bilo po phase-shiftu, rezoluciji ili dinamickom opsegu, da ne pominjemo interferenciju spoljnih EM izvora na kablove kojim ide taj analogni signal.
Ako hoces bukvalan primer, ubaci LineOut sa muzickog stuba u LineIn na zvucnoj kartici i izsampluj pesmu, onda ripuj tu pesmu na kompu direktno sa CDa digitalno i uporedi dva snimka

[ NemanjaCSHARP @ 24.07.2008. 22:27 ] @

Hvala na odgovorima .. ja nisam bash upoznat sa tim stvarima , ali da postavim jedno pitanje:

Bitmap fajl (BMP 32bit) rezolucije 1024x768 zauzima otprilike 4 MB;
znachi da u tom bitmapu ima 786,432 pixela;

1 min ( 13 kbit/s) zvuka u wav formatu zauzima oko 100KB;
znachi ako bi "upakovali" da svaka boja pixela je drugi ton mi bi mogli u 1 minutu da smestimo npr 60000 pixela;
znachi da bi ovu sliku mogli da spakujemo u 1.5 MB wav fajla;

I onda kad bi je prikazivali samo prepoznajemo zvuk svakog pixela :):)

Verovatno je ovo nemoguce , suludo , glupo ali nepoznajem te audio stvari i ne znam da li da pochinjem da se uplicem u dalju razradu ove ideje???

Hvala

[ mmix @ 24.07.2008. 23:01 ] @

Ako nista, iznenadio si me

Kompresija slike zvukom je novina za mene

2^32 boja znaci da ti treba 2^32 ili nesto cirka malo vise od 4 milijarde razlicitih prepoznatljivih tonova i ti to hoces da stavis u 13kbit/s sample koji u 16 bita rezolucije ima 812 sample-ova po sekundi, sto ce reci nemas ni jedan cestiti sample po milisekundi. To sto ti hoces ne moze, a i da uzmes 44khz signal i da kazemo da mozes da kodiras 2^32 razlicitih tonova u 44 16 bitna sample-a, taj wav bi ti bio oko 70Mb

Prosto matematicki, ne postoji nacin da 32 bita jednog pixela kodiras u manje od 32 bita audio signala.

[ jablan @ 24.07.2008. 23:02 ] @

Citat:

NemanjaCSHARP: da li da pochinjem da se uplicem u dalju razradu ove ideje???

Ako počneš, počni prvo od toga šta je ton, šta je frekvencija, šta je sempl itd. Vidim da ti i te osnovne stvari slabo idu... ;)

[ NemanjaCSHARP @ 24.07.2008. 23:43 ] @

92' sam imam ja vremena ...:)) hvala vam za odgovore. sad sam se malo osvestio ...:)

[ Burgos @ 25.07.2008. 11:20 ] @

Dalje, postoji pitanje prepoznavanja osnovne frekvencije tona. Verovatno bi trebalo da primenis DFT (ili BFT), da izdvojiš (napraviš) spektar signala, i da pronađeš fundamentalnu frekvenciju - što, ukoliko nisi upoznat sa DOS-om (DSP-om, kako voliš) ume da napravi košmar.

A sada vidim da je mmix jako lepo odgovorio na tvoju ideju ;).

[ Shadowed @ 25.07.2008. 12:23 ] @

Citat:

mmix: Prosto matematicki, ne postoji nacin da 32 bita jednog pixela kodiras u manje od 32 bita audio signala.

Sto da ne? Posto slika svakako ne koristi sve boje (nema toliko piksela koliko boja), boje se mogu indeksirati za tu konkretnu sliku i upisati u manje bit-ni broj. Eto, bas u tom slucaju sa 1024x768, moze 20-bit.

[ mmix @ 25.07.2008. 14:16 ] @

Citat:

Shadowed: Sto da ne? Posto slika svakako ne koristi sve boje (nema toliko piksela koliko boja), boje se mogu indeksirati za tu konkretnu sliku i upisati u manje bit-ni broj. Eto, bas u tom slucaju sa 1024x768, moze 20-bit.

A sta cemo sa mapping tabelom iliti paletom?
Paleta je specificna za sliku i mora da ide sa istom.
Matematicki, ustedeo si 12 bita po pikselu, ili 1.5bajt, tako da si smanji sirove podatke za 768k*1.5 = 1152kb.
Maping tabela mora da ima 768k elemenata od kojih svaki ima 32 bita za mapiranu boju (pod uslovom da kao broj boje koristimo index u paleti) = 4bajta i dodatni teret palete je 768k*4bajta = 3Mb

suma sumarum slika je veca za 1920kb

[ Shadowed @ 25.07.2008. 14:43 ] @

E, to je sad druga prica, poenta je bila da je moguce da se prebaci u manje bit-ni zapis, nisam pominjao isplativost toga :]

[ masetrt @ 25.07.2008. 15:42 ] @

Citat:

Upravu si za analognu modulaciju digitalnog signala. Medjutim za sve ostalo gresis. Vec je bilo ideja (realizovanih) bas da se slika predstavi kao uredjena kolekcija tonova i obratno (razne mistifikacije Da Vincija i Betovena), a ponovno rekonstruisanje slike (u drugom slucaju tona) na drugoj masini su bile 100% uspesne. Takodje pomenimo softver za automatizovanu digitalizaciju podataka (npr prevodjenje skeniranog rukopisa u digitalne textualne podatke). Po tvojoj tvrdnji softver bi bio uspesan samo ako bi rukopis bio konstantan bez ikakvih modifikacija od slova do slova. Tj ti tvrdis da se prepoznavanje i dekodovanje analognog signala radi ad hoc tj 1-1 (jednom jedinstvenom delu signala odgovara tacno jedan digitalni podatak)
E pa to se ne radi na takav nacin. Kod takvog softvera se koriste druge metode koje se uglavnom svode na odredjivanju karakteristicnih pikova ili tacaka, a zatim drugi deo softvera (trenirana neuronska mreza, algoritmi interpolacije,....zavisno od konkretnih potreba) "dekoduju" analogni signal.
Prost primer: zamisli dva racunara koja izmedju sebe mogu da komuniciraju iskljucivo putem dva mikrofona i dva zvucnika, i zamisli krsh kablove i generalno krsh opremu. Komunikacija izmedju ta dva racunara bi savrseno mogla da se uradi putem npr morzeove azbuke. Tako bi analogni signal poslat sa jednog racunara uz sve sumove bez problema mogao da "desifrujes" na drugom racunaru, upravo koriscenjem taktike pikova.
Takodje uzmi naprimer softver za prepoznavanje rukopisa i njegovo prevodjenje u digitalni oblik. Kao sto se zna za takav softver potpuno nema veze da li si pisao flomasterom bojicom ili cetkicom i koju si boju od slucaja do slucaja koristio i na kakvom papiru, jer se tu nalazi "inteligenti deo softvera" koji ce sumove ignorisati, a nekim svojim tehnikama (koje se ralikuju od namene do namene) ostali deo dekodovati
Sad kompresija slike putem zvuka slazem se da je losa ideja a pogotvo sto je ne funkcionalana, medjutim

Citat:

Prosto matematicki, ne postoji nacin da 32 bita jednog pixela kodiras u manje od 32 bita audio signala.

matematicki se ovde bas olako upotrebljava. Ovo je itekako moguce. Razmisli malo da li se FFFFFFFF ili F0F0F0F0 moze da se predstavi sa manje od 32 bita?

[ mmix @ 25.07.2008. 18:05 ] @

Imas li ti neki link za tu pricu o da vicniju? I bas me interesuje ta neuronska mreza koja kompenzuje greske u sistemu prenosa DAC-zvucnik-vazduh-mikrofon-ADC bilo koje vrste i koliko je minimalna duzina tonskog signala za pouzdanu detekciju bilo preko NM ili kroz interpolacju.

A i ja sam rekao "tesko" ne nemoguce, ako hoces bolji primer od morzea, uzmi Touch Tone Dial dodaj mu jos 6 frekvencija i jednim audio signalom mozes da preneses 4 bita informacija, ali koliko takvih informacija mozes da preneses u jednoj sekundi tako da uredjaj sa druge strane moze da ih dekodira u situaciji kad nema modulirani carrier-signal. Sasvim sigurno daleko manje jer sistem mora da kompenzuje sve nepravilnosti u signalu plus dovoljno trajanje i signala kako bi se informacija detektovala kroz FFT ili Gercela i dovoljno trajanje tisine izmedju dva signala da bi se detektor "resetovao" za sledeci signal; odatle "tesko" jer postoje mnogo efikasniji i bolji metodi za komunikaciju ukljucujuci i modulaciju.

Citat:

masetrt: matematicki se ovde bas olako upotrebljava. Ovo je itekako moguce. Razmisli malo da li se FFFFFFFF ili F0F0F0F0 moze da se predstavi sa manje od 32 bita?

Ok, ako hoces striktno "matematicki" daj mi resenje za T iz donje postavke i ja cu priznati da sam pogresio:

Neka je A skup celih brojeva

i neka je B skup celih brojeva

. Definisi preslikavanje T tako da je T jedan-na-jedan perslikavanje skupova A i B.

Ako ovo resis, svaka cast. :)

[ masetrt @ 25.07.2008. 19:09 ] @

Citat:

Za link ces morati malo da sacekas jer to sam citao nekih devedesetih. Za trenirane neuronske mreze naveo sam ti primere OCR softvera. Potpuno isti princip se primenjuje za bilo koji princip prepoznavanja i dekodiranja signala. Greske u prenosu se detektuju i otklanjaju na druge nacine. Minimalna duzina tonskog signala je irelevatna za ovu raspravu jel direktno zavisi od hardvera.

Citat:

A i ja sam rekao "tesko" ne nemoguce, ako hoces bolji primer od morzea, uzmi Touch Tone Dial dodaj mu jos 6 frekvencija i jednim audio signalom mozes da preneses 4 bita informacija, ali koliko takvih informacija mozes da preneses u jednoj sekundi tako da uredjaj sa druge strane moze da ih dekodira u situaciji kad nema modulirani carrier-signal. Sasvim sigurno daleko manje jer sistem mora da kompenzuje sve nepravilnosti u signalu plus dovoljno trajanje i signala kako bi se informacija detektovala kroz FFT ili Gercela i dovoljno trajanje tisine izmedju dva signala da bi se detektor "resetovao" za sledeci signal; odatle "tesko" jer postoje mnogo efikasniji i bolji metodi za komunikaciju ukljucujuci i modulaciju.

Prvo imas pravo rekao si tesko, a ja sam shavtio kao nemouce. Drugo ne, tone dial nije bolji nacin od morzeove abuke koju sam bas namerno odabrao jer sam naglasio krsh hardver. Zato sto morzeova azbuka koristi jedan te isti ton i to u obliku: ., -, tisina. I upravo je primer sluzio samo za predstavu kako dva digitalna uredjaj mogu da komuniciraju putem analognog signala na najprostiji moguci nacin (seti se pikova koje sam pominjao). Naravno da postoje mnogo bolji nacini, ovo je primer koji veoma lako moze da se implementira i da radi. Koliko je brzo itd. opet irelevatno.

Citat:

Ok, ako hoces striktno "matematicki" daj mi resenje za T iz donje postavke i ja cu priznati da sam pogresio:

Neka je A skup celih brojeva i neka je B skup celih brojeva . Definisi preslikavanje T tako da je T jedan-na-jedan perslikavanje skupova A i B.

Kod matematike je jezik kojim se izrazavas veoma bitan. Ko je spominjao 1-1 preslikavanje. 1-1 Preslikavanje bi znacilo da se za svako a iz A moze naci tacno jedno b iz B tako da je f(a) = b. Naravno care da je to nemoguce. medjutim ti si rekao:

Citat:

Prosto matematicki, ne postoji nacin da 32 bita jednog pixela kodiras u manje od 32 bita audio signala.

Ja sam ti naveo primer jednog (ili bese dva) pixela koja mozes da predstavis sa manje od 32 pixela, sto znaci nasao sam pixel koji mozes da predstavis sa manje od 32 bita. Znaci ako si hteo da kazes:

"Prosto matematicki, ne postoji nacin da se svaki 32 bitni pixel kodira u manje od 32 bita audio signala, pod uslovom da imamo slucajan niz pixela"

to si i trebao da kazes

Opet da kazem potpuno se slazem da ne treba sliku kompresovati prebacivanjem u wav fajl. Ali ono sto sam ja hteo da pokazem je da tvoje tvrdnje nisu tacne. Jedan od nacina da se to uradi je da nevedes bar jedan primer koji pokazuje suprotno (opet stvar matematike u kojoj nema ono "izuzetak koji potvrdjuje pravilo").

Sto se kompresije tice primeni bilo koju losless kompresiju ili na niz pixela koji imas ili pak na svakom pixelu pojedinacno (naravno kad to ima smisla) i cap, teorijski postoji mogucnost da ce neki odpixela biti kompresovan (cak veoma velika mogucnost, kod bele pozadine, ili crne pozadine ,.....)

edit: Nasao sam na netu aplikacija se zove monalisa. Inace je lik koji ju je uradio i pre imao eksperimente konvertujuci razne digitalne podatke u zvuk i slicno.

_{[Ovu poruku je menjao masetrt dana 25.07.2008. u 20:27 GMT+1]}

[ misk0 @ 26.07.2008. 21:54 ] @

Citat:

mmix: A sta cemo sa mapping tabelom iliti paletom?
Maping tabela mora da ima 768k elemenata od kojih svaki ima 32 bita za mapiranu boju (pod uslovom da kao broj boje koristimo index u paleti) = 4bajta i dodatni teret palete je 768k*4bajta = 3Mb ;)
suma sumarum slika je veca za 1920kb

To je najgori slucaj kad bi imao sliku sa svim razlicitim bojama, ali ako podjes od pretpostavke da se velik broj boja ponavlja ta racunica je daleko optimisticnija, zar ne? :)