[ Neusaglasen @ 29.01.2024. 16:41 ] @
Pozdrav svima.Već nekoliko dana se mučim sa sortiranjem po abecednom redosledu u pdf izvjestaju koji kreiram uz pomoć TCPDF biblioteke. Baza se nalazi na XAMPP serveru. Za bazu kao i za tabele DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci. U tom slučaju Ne pravi razliku između slova ć, č i c kao ni između s i š, a npr. prezime koje počinje sa slovom đ stavlja na kraj. Pokušao sam i sa binary collation u ORDER BY kroz upit, tada razlikije slova ali ponovo đ dođe na kraju. Probao sam i sa utf8mb4_serc_ci li MySQL/MariaDB ne podržava nju. utf8mb4_unicode_520_ci sortira po abecedi ali ne razlikuje slova c i ć. Proba sam da napravim neki custom sort ali nisam resio problem. Ako neko ima neki predlog bio bih zahvalan.
[ Neusaglasen @ 29.01.2024. 18:39 ] @
Upravo sam probao sa COLLATE utf8mb4_croatian_ci i radi kako treba. Da li je u redu da za bazu kao i za tabele postavljam DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_croatian_ci? U bazu se većinom unose podaci koji sadrže naša slova i koje treba prikazati kao izveštaj u pdf-u.
Interesuje me da li se izveštaj može prikazati i ćirilicom a da se ništa ne menja u bazi, tj. samo da se prebaci iz latinice u ćirilicu u izveštaju i koliko je to uspešno za naša slova lj, nj?
[ bogdan.kecman @ 29.01.2024. 19:11 ] @
baza ne ume da radi preslovaljavanje niti je to posao baze, postoje biblioteke za preslovljavanje, cirilica u latinicu je jednoznacna, latinica u cirilicu nije (zbog nj, dz i slicno) i za to neke biblioteke koriste recnike a neke samo ostave kako je .. idealno u bazi drzis cirilicu pa ispisujes onda latinicu ili cirilicu po potrebi

croatian_* kolacija bi trebalo da lepo radi sa latinicnim dvoznacima (nj, dz ..) cirilica se sortira ok ali se sortira posle latinice

serbian_* kolacija nije uradjena jer kada sam ja trazio da je napravimo oracle je zahtevao zvanicni info od drzave, ja sam napravio da se poredjenje vrsi tako da su cirilica i latinica isti tako da se rec latinicom i cirilicom pronalazi bez obzira da li se trazi latinicom ili cirilicom, da se sortira tako da se cirilica i latinica gledaju isto tako da je latinicno A i cirilicno A isto slovo a ne razlicita slova ... ali nijedna kontaktirana (a sve sam kontaktirao) institucija nije htela da da zvanicnu izjavu te je oracle tada odbacio serbian* kolacije :(
[ Neusaglasen @ 29.01.2024. 19:22 ] @
Hvala puno na detaljnom odgovoru. Da li bi mi mogli preporučiti neku biblioteku za preslovljavanje u ćirilicu koja koristi rečnik?
[ Predrag Supurovic @ 30.01.2024. 10:14 ] @
Ja sam to resava tako sto sam z akolone koje je terbalo da precizno sortiram pravio dotnekolone u koje sam upisivao konvertovan sadrzaj u latinsko pismo bez nasih slova specijalno formatirano tako da bilo koji latinicni sort daje ispravno sortiranje za tekst na srpskom jeziku. Sortiranje pa i pretragu sam radio preko tih kolona. Tako nije bilo cak ni bitno da li se trazi cirilicni ili latinicni izraz.
[ Predrag Supurovic @ 30.01.2024. 10:16 ] @
Citat:
bogdan.kecman:
serbian_* kolacija nije uradjena jer kada sam ja trazio da je napravimo oracle je zahtevao zvanicni info od drzave, ja sam napravio da se poredjenje vrsi tako da su cirilica i latinica isti tako da se rec latinicom i cirilicom pronalazi bez obzira da li se trazi latinicom ili cirilicom, da se sortira tako da se cirilica i latinica gledaju isto tako da je latinicno A i cirilicno A isto slovo a ne razlicita slova ... ali nijedna kontaktirana (a sve sam kontaktirao) institucija nije htela da da zvanicnu izjavu te je oracle tada odbacio serbian* kolacije :(


Kakav info traže?

Jesi li probao sa Maticom srpskom, Odeljenje za književnost i jezik?

[ bogdan.kecman @ 30.01.2024. 20:59 ] @
@neusaglasen - pojma nemam
@pedja - matica srpska, fakultet, vukova zaduzbina, sanu, ministarstvo prosvete ... traze zvanicni info da je to prava kolacija ... problem je sto nijedna od ovih institucija nece da prizna latinicu, cirilica se sama po sebi po unicode sortira ok ali se sortira prvo latinica pa cirilica, jednacenje karaktera ne postoji i slicno, ja sam napravio kolaciju gde se jednace cirilica i latinica tako da se sortira kako treba, imas kolaciju sa azbukom i kolaciju sa abecedom ali latin A i cyrilic A su isto slovo nj kao jedan unicode karakter latinicni, nj kao dva latinicna karaktera i nj cirilicni unicode karakter su "isti karakter" i slicno ali jbg oracle to nije hteo da prihvati jer ne postoji papir da je to tako i nijedno srpsko telo nije htelo da kaze i potpise da je to tako jer "latinica nije srpska" abitno sto je pola srpskih knjiga izdato na latinici (i medjunarodno se sada vode kao hrvatska kulturna bastina ... pisao sam o tome mnogo puta)