×
HTML 字符集HTML ASCIIHTML ANSIHTML ISO-8859HTML UTF-8HTML 符号

HTML UTF-8

UTF-8 Latin 基本UTF-8 Latin 补充UTF-8 Latin 扩展 AUTF-8 Latin 扩展 BUTF-8 变音符号UTF-8 Greek 与 CopticUTF-8 Cyrillic 基本UTF-8 Cyrillic 补充

HTML 符号

UTF-8 常用标点符号UTF-8 货币符号UTF-8 字母式符号UTF-8 箭头UTF-8 数学运算符UTF-8 制表符UTF-8 方块元素UTF-8 几何图形UTF-8 杂项符号UTF-8 印刷符号

HTML 实体

HTML4 实体HTML5 实体 AHTML5 实体 BHTML5 实体 CHTML5 实体 DHTML5 实体 EHTML5 实体 FHTML5 实体 GHTML5 实体 HHTML5 实体 IHTML5 实体 JHTML5 实体 KHTML5 实体 LHTML5 实体 MHTML5 实体 NHTML5 实体 OHTML5 实体 PHTML5 实体 QHTML5 实体 RHTML5 实体 SHTML5 实体 THTML5 实体 UHTML5 实体 VHTML5 实体 WHTML5 实体 XHTML5 实体 YHTML5 实体 Z

HTML UTF-8


Unicode 联盟(Unicode Consortium)

Unicode 联盟(Unicode Consortium)开发了 Unicode 标准(Unicode Standard)。他们的目标是使用标准的 Unicode 转换格式(即 UTF,全称 Unicode Transformation Format)取代现有的字符集。

Unicode 标准是一个成功的创举,在 HTML、XML、Java、JavaScript、E-mail、ASP、PHP 中都得到实现。Unicode 标准也得到许多操作系统和所有现代浏览器的支持。

Unicode 联盟与领先的标准开发组织合作,这些组织有 ISO、W3C 和 ECMA。


Unicode 字符集

Unicode 可以由不同的字符集实现。最常用的编码是 UTF-8 和 UTF-16:

字符集 描述
UTF-8 UTF8 中的字符可以是 1 到 4 字节长。UTF-8 可以代表 Unicode 标准中的任何字符。UTF-8 向后兼容 ASCII。UTF-8 是电子邮件和网页的首选编码。
UTF-16 16 位 Unicode 转换格式是一种可变长度的 Unicode 字符编码,能够编码整个 Unicode 指令表。UTF-16 主要用于操作系统和环境,如 Microsoft Windows、Java 和 .NET。

提示:Unicode 的前 128 个字符(与 ASCII 一一对应)使用一个与 ASCII二进制值相同的八位组进行编码,使有效的 ASCII 文本在进行 UTF-8 编码时也是有效的。

提示:所有的 HTML 4 处理器支持 UTF-8,所有的 HTML 5 和 XML 处理器支持 UTF-8 和 UTF-16!


HTML5 标准:Unicode UTF-8

因为 ISO-8859 中字符集大小是有限的,且在多语言环境中不兼容,所以 Unicode 联盟开发了 Unicode 标准。

Unicode 标准覆盖了(几乎)所有的字符、标点符号和符号。

Unicode 使文本的处理、存储和运输,独立于平台和语言。

HTML-5 中默认的字符编码是 UTF-8。

下面列出了一些 HTML5 支持的 UTF-8 字符集:

字符集 十进制 十六进制
C0 控制与基本的 Latin(C0 Controls and Basic Latin) 0-127 0000-007F
C1 控制与 Latin-1 的补充(C1 Controls and Latin-1 Supplement) 128-255 0080-00FF
Latin 扩展 A(Latin Extended-A) 256-383 0100-017F
Latin 扩展 B(Latin Extended-B) 384-591 0180-024F

如果 HTML5 网页使用不同于 UTF-8 的字符,则需要在 <meta> 标签中指定,如下:

实例

<meta charset="ISO-8859-1">

分类导航

关注微信下载离线手册

bootwiki移动版 bootwiki
(群号:472910771)