[ Ivek33 @ 12.08.2015. 16:21 ] @
Ne znam jesam li pogodio grupu foruma, pa molim moderatora da premjesti ako nisam.

Dakle, imam preko 1500 klasičnih *.html files (odrađenih u FrontPage/DreamWeaver koji imaju encoding windows-1250, želim sve files konvertirati u UTF-8
Ima li netko neku skriptu koja može konvertirati sve HTML datoteke u folderu i subfolderima u jednom potezu

Trenutna situacija je
- svi *.html files nalaze se na putanji C:\Temp\ i oni su HTML encoding "windows-1250" a poneki i "utf8". Folder C:\Temp sadrži subfoldere
- u svakom *.html file između <head>...</head> imam slijedeću liniju koda
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"> (ali ne funkcionira)

Potrebno mi je slijedeće:

1. Skripta treba u svim files (u folderu i subfolders) pregledati sve files i bez obzira u kojem encodingu su da ih konvertira u UTF-8 (ja sam neke ručno jednu po jednu radio preko Noptepad++ ali to je zamarajuće i dugotrajno)
2. Nakon izvršenog konvertiranja encodinga u UTF-8, snimiti sve files

Ili možda se to može odraditi Notepad++ ali ja ne znam kako za sve files u folderu. Ako idem jedan po jedan file to nije problem, ali preko 1500 files već jeste

Može li netko pomoći: gotovom isprogramiranom VBS skriptom ili već bili kakvom, savjetom, linkom, iskustvom? Koristim Windows 7, tako da ne dolazi u obzir ideja sa programima za Linux.
[ Jbyn4e @ 12.08.2015. 22:25 ] @
Ovo deluje kao ono sto tebi treba:
http://www.elfdata.com/encodingmaster/

Mada bi ja radije instalirao Cygwin kao sto kazu ovde...:
http://superuser.com/questions...tch-convert-files-for-encoding

P.S. Imas tamo i powershell varijantu...
[ Ivek33 @ 13.08.2015. 09:00 ] @
Citat:
Jbyn4e: Ovo deluje kao ono sto tebi treba:
http://www.elfdata.com/encodingmaster/

Hvala ti za javljanje. Jesi li koristio ovaj program, imaš li iskustva?

Citat:
Jbyn4e: Mada bi ja radije instalirao Cygwin kao sto kazu ovde...:
http://superuser.com/questions...tch-convert-files-for-encoding
Ovo sam već gledao i baš mi ne ide na ruku. Čitao sam za neke probleme na Win OS-u. A i upis raznih naredbi (sa kojima nisam na "ti") me odbijaju od ovakvih programa.

BTW: Tragam za opcijom u 'Notepad++' ili u 'UltraEdit' editorima ali izgleda da to nije moguće u njima. Eh, da je neka VBS skripta to bi bilo najbolje :)
Pokreneš VBS, upišeš source/destination path, vrstu encodinga from/to i završiš posao sa klikom, ali to je moguće samo za programere.
pozdrav
[ Ivek33 @ 13.08.2015. 09:08 ] @
Citat:
Jbyn4e:
Ovo deluje kao ono sto tebi treba:
http://www.elfdata.com/encodingmaster/
Javlja error, traži da se kupi?
Odustao sam od njega.
[ 3okc @ 13.08.2015. 09:38 ] @
Izgleda da makar jedan - ako ne i oba editora (Notepad++, UE) imaju plagin koji omogućuje traženu konverziju ali se nisam udubljivao.

Ovo sam usput izguglao i čini se da bi moralo da radi: Batch file conversion - character set and BOM detection of html files
[ Ivek33 @ 13.08.2015. 18:49 ] @
Citat:
3okc: Ovo sam usput izguglao i čini se da bi moralo da radi:
Hvala, pogledat ću, mada mi se ovako na prvu čini da trebam prvo proučiti što, gdje i kako s tom skriptom da bi radila ono što ja želim.

za ove plugine tragam ali za sada nisam naišao na prave ključne riječi
[ Ivek33 @ 14.08.2015. 15:07 ] @
Probao sam neke programe. Ovaj je dobar ali samo za TXT files

Isprobao sam neke *.py skripte za Notepad++ ali nikako da ih prilagodim mojim potrebama. Ova mi se čini najbolja od svega što sam našao.
Ima li netko programerskog znanja da prepravi ovu skriptu. Folderi i subfolderi/*.html files mi se nalaze u C:\Temp
Gdje može biti greška. Notepad++ je verzija 6.8.1
Ovdje se konvertira u "UTF-8 without BOM" a meni treba "UTF-8".

Međutim, skripta ne radi uopće?
Kreirao sam Python/New Script i snimio.
Resetirao Notepad++ i pokrenuo skriptu, ali ništa se ne događa.

Code:

# Python script for bulk conversion of HTML and PHP files to UTF-8 without BOM using Notepad++
#
# @author Zion Ng <[email protected]>
# @link [Source] https://github.com/zionsg/stan...-scripts/tree/master/CrawlSite
# @see http://notepad-plus-plus.org/ for Notepad++
# @see http://npppythonscript.sourceforge.net/ for PythonScript plugin for Notepad++
#
import os;
import sys;
# Modify path and extensions of files to convert here
path = 'C:\\Temp'
# path = 'C:\\Temp\\files'
extensions = ['.htm', '.html', '.php', '.phtml']
# Function to convert files in dir to UTF-8 without BOM using Notepad++
def processDirectory(args, dir, files):
console.write('Directory: ' + dir + "\r\n")
for file in files:
for extension in extensions:
if file[-len(extension):] == extension:
console.write(' ' + file + "\r\n")
notepad.open(dir + "\\" + file)
notepad.runMenuCommand('Encoding', 'Convert to UTF-8 without BOM')
notepad.save()
notepad.close()
break
# Run script
# processDirectory() will be called recursively for each directory encountered
os.path.walk(path, processDirectory, None)
console.write("\r\n" + 'DONE!' + "\r\n")
[ Jbyn4e @ 14.08.2015. 20:36 ] @
Tebi treba baš taj without BOM.

P.S. Nemam pojma kako se ovo pokreće, nisam koristio .py u notepad++, ali ima tamo gore u meniju "Run" pa probaj sa tim...
[ Ivek33 @ 15.08.2015. 08:12 ] @
Citat:
Jbyn4e: Tebi treba baš taj without BOM
Možeš li mi objasniti zašto misliš da mi treba "...without BOM" a nije dovoljan samo UTF-8? Zanima me na što misliš, koja je razlika?

Kada u Notepad++ pojedinačno odradim 'convert to utf-8' sasvim je ok web stranica.

btw: odustao sam od python skripte. Morao sam dodatno instalirati PYTHON aplikaciju i štošta još podešavati u Notepad++ ali nije prošlo. Ništa se ne događa kada pokrenem raznorazne skripte, jednostavno konzola je prazna bez ikakvih događanja. Vjerojatno moje nedovoljno poznavanje rada sa programiranjem, skriptama i svim potrebnim aplikacijama i podešavanjima ima utjecaja.

Idem sada u drugom smjeru raznim drugim kombinacijama.
pozdrav
[ Ivek33 @ 15.08.2015. 18:08 ] @
Riješio sam problem na drugačiji način
Za sve one koji imaju isti problem detaljan tutorijal korak po korak pogledajte na linku

- Konvertiranje encodinga windows-1250 u UTF-8
[ Jbyn4e @ 02.09.2015. 21:51 ] @
Citat:
Ivek33:
Citat:
Jbyn4e: Tebi treba baš taj without BOM
Možeš li mi objasniti zašto misliš da mi treba "...without BOM" a nije dovoljan samo UTF-8? Zanima me na što misliš, koja je razlika?

Nisam bio tu pa nisam primetio pitanje..

Dakle, kada ima BOM na početku UTF-8 enkodovanog fajla, a koristiš PHP i sesije, javljaće ti PHP grešku. Pisano je na forumu više puta dosad o tome pre par godina. Zaboravi na to zasad, rešio si problem.