|
 |
|
MENU |
|
|
|
|
|
 |
|
Zestawy znaków HTML |
|
|
|
|
|
|
|
|
|
|
|
Zestawy znaków HTML
Aby wyświetlić stronę HTML poprawnie, przeglądarka musi wiedzieć, co znak ustawiony w użyciu. Znak ustawiony jest na świecie na początku internetowych był ASCII. ASCII obsługuje numery od 0-9, wielkie lub małe litery alfabetu angielskiego, a niektóre znaki specjalne. Pełne odniesienie ASCII. Od wielu krajach stosowanie znaków, które nie są częścią ASCII, domyślnie ustawiony jest na charakter nowoczesnych przeglądarkach jest ISO-8859-1. Pełne ISO-8859-1 odniesienia. Jeśli strona sieci Web używa innego zestawu znaków niż ISO-8859-1, należy określić, w
tag. Spróbuj sam Zestawy znaków ISO Jest Międzynarodowej Organizacji Normalizacyjnej (ISO), który definiuje standard zestawów znaków z różnych alfabetów / językach. Różnych zestawów znaków używanych na całym świecie są wymienione poniżej:
Character set
|
Description
|
Covers
|
ISO-8859-1
|
Latin alphabet part 1
|
North America, Western Europe, Latin America, the Caribbean, Canada, Africa
|
ISO-8859-2
|
Latin alphabet part 2
|
Eastern Europe
|
ISO-8859-3
|
Latin alphabet part 3
|
SE Europe, Esperanto, miscellaneous others
|
ISO-8859-4
|
Latin alphabet part 4
|
Scandinavia/Baltics (and others not in ISO-8859-1)
|
ISO-8859-5
|
Latin/Cyrillic part 5
|
The languages that are using a Cyrillic alphabet such as Bulgarian, Belarusian, Russian and Macedonian
|
ISO-8859-6
|
Latin/Arabic part 6
|
The languages that are using the Arabic alphabet
|
ISO-8859-7
|
Latin/Greek part 7
|
The modern Greek language as well as mathematical symbols derived from the Greek
|
ISO-8859-8
|
Latin/Hebrew part 8
|
The languages that are using the Hebrew alphabet
|
ISO-8859-9
|
Latin 5 part 9
|
The Turkish language. Same as ISO-8859-1 except Turkish characters replace Icelandic ones
|
ISO-8859-10
|
Latin 6 Lappish, Nordic, Eskimo
|
The Nordic languages
|
ISO-8859-15
|
Latin 9 (aka Latin 0)
|
Similar to ISO 8859-1 but replaces some less common symbols with the euro sign and some other missing characters
|
ISO-2022-JP
|
Latin/Japanese part 1
|
The Japanese language
|
ISO-2022-JP-2
|
Latin/Japanese part 2
|
The Japanese language
|
ISO-2022-KR
|
Latin/Korean part 1
|
The Korean language
|
Standard Unicode Dlatego, że postać zestawów wymienionych powyżej wielkości są ograniczone, i nie są kompatybilne w wielojęzycznych środowiskach, Unicode Consortium opracowało standard Unicode. Standard Unicode obejmuje wszystkie znaki, znaki przestankowe i symbole na świecie. Unicode pozwala przetwarzania, przechowywania i wymiany danych tekstu bez względu na platformę, bez względu na program, bez względu na język. Konsorcjum Unicode Konsorcjum Unicode Unicode Standard rozwija. Ich celem jest zastąpienie istniejących zestawów znaków z jego standard Unicode Transformation Format (UTF). Standard Unicode staje się sukces i realizowana jest w XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, itp. standard Unicode jest również wspierany w wielu systemach operacyjnych i wszystkich nowoczesnych przeglądarkach. Unicode Consortium współpracuje z czołowymi standardów rozwoju organizacji, np. ISO, W3C i ECMA. Unicode mogą być realizowane w różnych zestawów znaków. Najczęściej używane są kodowania UTF-8 i UTF-16:
Character-set
|
Description
|
UTF-8
|
A character in UTF8 can be from 1 to 4 bytes long. UTF-8 can represent any character in the Unicode standard. UTF-8 is backwards compatible with ASCII. UTF-8 is the preferred encoding for e-mail and web pages
|
UTF-16
|
16-bit Unicode Transformation Format is a variable-length character encoding for Unicode, capable of encoding the entire Unicode repertoire. UTF-16 is used in major operating systems and environments, like Microsoft Windows 2000/XP/2003/Vista/CE and the Java and .NET byte code environments
|
Wskazówka: Pierwsze 256 znaków Unicode-sets odpowiadają 256 znaków ISO-8859-1. Wskazówka: Wszystkie HTML 4 procesory już wsparcie UTF-8 i wszystkie procesory XML, XHTML i wsparcie UTF-8 i UTF-16!
|
Teraz 11183 odwiedzający (25989 wejścia) |
|
|
|
|
|
 |
|
Logowanie |
|
|
|
|
|
|
|
|
|
|