Specyfikacja
Gżegżółka jest konwerterem standardów kodowania oraz końców linii. Rozpoznaje wszystkie obsługiwane standardy kodowania polskich znaków. Konwertuje nie tylko polskie ogonki, stosowane są pełne tabele konwersji (np. w przypadku konwersji Windows 1250 na ISO 8859-2 zostaną przekonwertowane również znaki czeskie, węgierskie, etc.). Obsługiwane są znaki diakrytyczne (czyli: ą, ź, ħ, ə, œ, ų...) praktycznie wszystkich alfabetów pochodzenia łacińskiego (Latin). Obsługiwane są również inne alfabety: cyrylica (Cyrillic), hebrajski (Hebrew, אלף-בית), grecki (Greek, Ελληνικό αλφάβητο) oraz arabski (Arabic). Nie są obsługiwane (i póki co nie planuję) ideogramy (Chiny, Japonia, Korea).
Licencja na użytkowanie programu wymaga akceptacji umowy licencyjnej i rejestracji. Możesz testować program bez rejestracji, jednak przeszkadzać Ci będzie irytator.
Możliwości Gżegżółki
- Konwersja ok. 80 standardów kodowania, w tym: ISO, Windows, IBM, Apple Macintosh i Unicode (little- i big endian, UTF-8, UTF-7, encje). Proste definiowanie nowych standardów.
- Precyzyjne rozpoznawanie standardu kodowania (polskie standardy). Odczytuje standard z opisu w pliku (dotyczy HTML, XHTML i XML), lub sygnatury (Unicode BOM).
- Bezstratnie konwertuje pliki HTML, XML i XHTML podstawiając encje (character entities) w miejsce znaków nie obsługiwanych w standardzie docelowym.
- Usuwa polskie znaki, a także inne znaki diakrytyczne i symbole spoza standardu ASCII, podstawiając w ich miejsce odpowiedniki logiczne lub wizualne np. ą -> a, ¾ -> 3/4, ® -> (R), æ -> ae. Funkcja jest przydatna przy przygotowywaniu plików z napisami dla niektórych odtwarzaczy XviD/DivX.
- Posiada narzędzia: konwerter schowka oraz wizualne rozpoznawanie standardu. Usprawniają one pracę z dokumentami w różnych standardach i językach.
- Konwertuje / wstawia / usuwa znaczniki opisy kodowania w plikach HTML, XHTML i XML. Konwertuje format końców linii (EOL), obsługiwane: CRLF (DOS/Win), LF (Unix), CR (Macintosh).
- Konwertuje dowolną liczbę plików za jednym razem. Obsługuje tzw. wildcards (np. *.txt, *.htm?), przy wyszukiwaniu plików z możliwością uwzględnienia podkatalogów. Pomija pliki o określonych rozszerzeniach.
- Rozbudowane możliwości konfiguracyjne, umożliwiające dostosowanie programu do własnych potrzeb.
Obsługiwane standardy kodowania
- Unicode:
Unicode UTF-8,
Unicode UTF-7,
Unicode LE (Intel),
Unicode BE (Motorola),
Unicode - encje,
Unicode - sekwencje escape
- ASCII (brak polskich znakow)
- Windows:
Windows 1250 (Europa Środkowa),
Windows 1251 (cyrylica),
Windows 1252 (zachodni),
Windows 1253 (grecki),
Windows 1254 (turecki),
Windows 1255 (hebrajski),
Windows 1256 (arabski),
Windows 1257 (bałtycki),
Windows 1258 (wietnamski)
- ISO:
ISO 8859-1 (zachodni),
ISO 8859-2 (Europa Środkowa),
ISO 8859-3 (Europa Wschodnia, Esperanto),
ISO 8859-4 (bałtycki),
ISO 8859-5 (cyrylica),
ISO 8859-6 (arabski),
ISO 8859-7 (grecki),
ISO 8859-8 (hebrajski),
ISO 8859-9 (turecki),
ISO 8859-10 (nordycki),
ISO 8859-11 (tajlandzki),
ISO 8859-13(bałtycki),
ISO 8859-14 (celtycki),
ISO 8859-15 (zachodni),
ISO 8859-16 (rumuński)
- IBM (DOS):
IBM CP437 (Stany Zjednoczone),
IBM CP737 (grecki 437G),
IBM CP775 (bałtycki),
IBM CP850 (zachodni),
IBM CP852 (Europa Środkowa),
IBM CP855 (cyrylica),
IBM CP857 (turecki),
IBM CP860 (portugalski),
IBM CP861 (islandzki),
IBM CP862 (hebrajski),
IBM CP863 (francuski kanadyjski),
IBM CP864 (arabski),
IBM CP865 (nordycki),
IBM CP866 (cyrylica - rosyjski),
IBM CP869 (grecki współczesny)
- Mac:
Mac zachodni,
Mac Europa Środkowa,
Mac cyrylica,
Mac grecki,
Mac islandzki,
Mac turecki,
Mac rumuński,
Mac chorwacki,
Mac dingbats
- KOI8:
KOI8-R (cyrylica),
KOI8-U (cyrylica - ukraiński),
KOI8-RU (cyrylica rosyjski/ukraiński)
- historyczne polskie:
Mazovia,
FIDO Mazovia,
CSK,
Cyfromat,
Dom Handlowy Nauki (DHN),
IINTE-ISIS, TAG,
Instytut Energii Atomowej w Świerku,
Logic,
Microvex,
Corel Ventura,
Elwro Junior CP/J,
Amiga PL,
TeX PL,
Atari Calamus,
CorelDRAW! 2.0,
ATM,
Amiga XPJ
Jak wygląda Gżegżółka?