HTML 编码

HTML 编码,也就是字符集,为了正确显示 HTML 页面,Web 浏览器必须知道要使用哪个字符集。


从 ASCII 到 UTF-8

ASCII 是第一个字符编码标准。ASCII 定义了 128 种可以在互联网上使用的字符:数字(0-9)、英文字母(A-Z)和一些特殊字符,比如:! $ + - ( ) @ < >。ISO-8859-1 是 HTML 4 的默认字符集。此字符集支持 256 个不同的字符代码。HTML 4 同时支持 UTF-8。ANSI(Windows-1252)是原始的 Windows 字符集。 ANSI 与 ISO-8859-1 相同,不同之处在于 ANSI 具有 32 个额外的字符。HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集,该字符集涵盖了世界上几乎所有的字符和符号!


HTML charset 属性

为了正确显示 HTML 页面,Web 浏览器必须了解页面中使用的字符集。这在 <meta> 标签中指定:

  1. <object classid="clsid:F08DF954-8592-11D1-B16A-00C0F0283628" id="Slider1"
  2. width="100" height="50">
  3. <param name="BorderStyle" value="1" />
  4. <param name="MousePointer" value="0" />
  5. <param name="Enabled" value="1" />
  6. <param name="Min" value="0" />
  7. <param name="Max" value="10" />
  8. </object>

字符集之间的差异

下表展示了上述字符集之间的区别:

NumbASCIIANSI8859UTF-8描述
32 空格
33!!!!感叹号
34""""引号
35####数字符号
36$$$$美元符号
37%%%%百分号
38&&&&连接符
39''''撇号
40((((左括号
41))))右括号
42****星号
43++++加号
44,,,,逗号
45----减号
46....句号
47////斜杠
480000数字 0
491111数字 1
502222数字 2
513333数字 3
524444数字 4
535555数字 5
546666数字 6
557777数字 7
568888数字 8
579999数字 9
58::::冒号
59;;;;分号
60<<<<小于
61====等于
62>>>>大于
63????问号
64@@@@邮件符号
65AAAA拉丁大写字母 A
66BBBB拉丁大写字母 B
67CCCC拉丁大写字母 C
68DDDD拉丁大写字母 D
69EEEE拉丁大写字母 E
70FFFF拉丁大写字母 F
71GGGG拉丁大写字母 G
72HHHH拉丁大写字母 H
73IIII拉丁大写字母 I
74JJJJ拉丁大写字母 J
75KKKK拉丁大写字母 K
76LLLL拉丁大写字母 L
77MMMM拉丁大写字母 M
78NNNN拉丁大写字母 N
79OOOO拉丁大写字母 O
80PPPP拉丁大写字母 P
81QQQQ拉丁大写字母 Q
82RRRR拉丁大写字母 R
83SSSS拉丁大写字母 S
84TTTT拉丁大写字母 T
85UUUU拉丁大写字母 U
86VVVV拉丁大写字母 V
87WWWW拉丁大写字母 W
88XXXX拉丁大写字母 X
89YYYY拉丁大写字母 Y
90ZZZZ拉丁大写字母 Z
91[[[[左方括号
92\\\\反斜杠
93]]]]右方括号
94^^^^上扬符号
95____下划线
96````抑音符
97aaaa拉丁小写字母 a
98bbbb拉丁小写字母 b
99cccc拉丁小写字母 c
100dddd拉丁小写字母 d
101eeee拉丁小写字母 e
102ffff拉丁小写字母 f
103gggg拉丁小写字母 g
104hhhh拉丁小写字母 h
105iiii拉丁小写字母 i
106jjjj拉丁小写字母 j
107kkkk拉丁小写字母 k
108llll拉丁小写字母 l
109mmmm拉丁小写字母 m
110nnnn拉丁小写字母 n
111oooo拉丁小写字母 o
112pppp拉丁小写字母 p
113qqqq拉丁小写字母 q
114rrrr拉丁小写字母 r
115ssss拉丁小写字母 s
116tttt拉丁小写字母 t
117uuuu拉丁小写字母 u
118vvvv拉丁小写字母 v
119wwww拉丁小写字母 w
120xxxx拉丁小写字母 x
121yyyy拉丁小写字母 y
122zzzz拉丁小写字母 z
123{{{{左曲括号
124||||垂直线
125}}}}右曲括号
126~~~~发音符
127DEL    
128   欧元符号
129 
130   单低 9 引号
131 ƒ  拉丁小写字母 f 带勾
132   双低 9 引号
133   省略号
134   短剑符号
135   双短剑符号r
136 ˆ  抑扬音符号
137   千分之一符号
138 Š  拉丁大写字母 S 带加仑
139   单左指角引号
140 Œ  拉丁文大写连字OE
141 无用
142 Ž  拉丁大写字母 Z 带加仑
143 无用
144 无用
145   左单引号
146   右单引号
147   左双引号
148   右双引号
149   子弹符号
150   横杠
151   长横杠
152 ˜  小波形符
153   交易标记符
154 š  拉丁小写字母 s 带加仑
155   单直角引号
156 œ  拉丁文小连字oe
157 无用
158 ž  拉丁小写字母 z 加仑
159 Ÿ  拉丁大写字母 Y 带分音符
160    不换行空格
161 ¡¡¡倒感叹号
162 ¢¢¢分号
163 £££英镑符号
164 ¤¤¤货币符号
165 ¥¥¥日元符号
166 ¦¦¦竖杠
167 §§§分节符
168 ¨¨¨分音符
169 ©©©版权符
170 ªªª阴性序数记号
171 «««左指双角引号
172 ¬¬¬
173 ­­­软连字符
174 ®®®注册标志
175 ¯¯¯长音符
176 °°°
177 ±±±正负号
178 ²²²上标二
179 ³³³上标三
180 ´´´重音符
181 µµµ微标志
182 段落符号
183 ···中间点
184 ¸¸¸下加符
185 ¹¹¹上标一
186 ººº阳性序数记号
187 »»»右指双角度引号
188 ¼¼¼四分之一
189 ½½½一半
190 ¾¾¾四分之三
191 ¿¿¿倒问号
192 ÀÀÀ拉丁大写字母 A 带沉音符
193 ÁÁÁ拉丁大写字母 A 带符号
194 ÂÂÂ拉丁大写字母 A 带音调符号
195 ÃÃÃ拉丁大写字母 A 带波形号
196 ÄÄÄ拉丁大写字母 A 带分音符
197 ÅÅÅ拉丁大写字母 A 上面带圈
198 ÆÆÆ拉丁大写字母 AE
199 ÇÇÇ拉丁大写字母 C 带下加符
200 ÈÈÈ拉丁大写字母 E 带沉音符
201 ÉÉÉ拉丁大写字母 E 带符号
202 ÊÊÊ拉丁大写字母 E 带音调符号
203 ËËË拉丁大写字母 E 带分音符
204 ÌÌÌ拉丁大写字母 I 带沉音符
205 ÍÍÍ拉丁大写字母 I 带符号
206 ÎÎÎ拉丁大写字母 I 带音调符号
207 ÏÏÏ拉丁大写字母 I 带分音符
208 ÐÐÐ拉丁大写字母 Eth
209 ÑÑÑ拉丁大写字母 N 带波形号
210 ÒÒÒ拉丁大写字母 O 带沉音符
211 ÓÓÓ拉丁大写字母 O 带符号
212 ÔÔÔ拉丁大写字母 O 带音调符号
213 ÕÕÕ拉丁大写字母 O 带波形号
214 ÖÖÖ拉丁大写字母 O 带分音符
215 ×××乘号
216 ØØØ拉丁大写字母 O 带线条
217 ÙÙÙ拉丁大写字母 U 带沉音符
218 ÚÚÚ拉丁大写字母 U 带符号
219 ÛÛÛ拉丁大写字母 U 带音调符号
220 ÜÜÜ拉丁大写字母 U 带分音符
221 ÝÝÝ拉丁大写字母 Y 带符号
222 ÞÞÞ拉丁大写字母 Thorn
223 ßßß拉丁小写字母 sharp s
224 ààà拉丁小写字母 a 带沉音符
225 ááá拉丁小写字母 a 带符号
226 âââ拉丁小写字母 a 带音调符号
227 ããã拉丁小写字母 a 带波形号
228 äää拉丁小写字母 a 带分音符
229 ååå拉丁小写字母 a 上面带圈
230 æææ拉丁小写字母 ae
231 ççç拉丁小写字母 c 带下加符
232 èèè拉丁小写字母 e 带沉音符
233 ééé拉丁小写字母 e 带符号
234 êêê拉丁小写字母 e 带音调符号
235 ëëë拉丁小写字母 e 带分音符
236 ììì拉丁小写字母 i 带沉音符
237 ííí拉丁小写字母 i 带符号
238 îîî拉丁小写字母 i 带音调符号
239 ïïï拉丁小写字母 i 带分音符
240 ððð拉丁小写字母 eth
241 ñññ拉丁小写字母 n 带波形号
242 òòò拉丁小写字母 o 带沉音符
243 óóó拉丁小写字母 o 带符号
244 ôôô拉丁小写字母 o 带音调符号
245 õõõ拉丁小写字母 o 带波形号
246 ööö拉丁小写字母 o 带分音符
247 ÷÷÷除号
248 øøø拉丁小写字母 o 带线条
249 ùùù拉丁小写字母 u 带沉音符
250 úúú拉丁小写字母 u 带符号
251 ûûû拉丁小写字母 u 音调符号
252 üüü拉丁小写字母 u 带分音符
253 ýýý拉丁小写字母 y 带符号
254 þþþ拉丁小写字母 thorn
255 ÿÿÿ拉丁小写字母 y 带分音符

ASCII 字符集

ASCII 使用 0 到 31(以及 127)之间的值作为控制字符。ASCII 使用 32 到 126 的值表示字母、数字和符号。ASCII 不使用 128 到 255 之间的值。


ANSI 字符集 (Windows-1252)

对于 0 到 127 的值,ANSI 与 ASCII 相同。ANSI 有一组专有的字符,其值从 128 到 159。对于 160 到 255 的值,ANSI 与 UTF-8 相同。


ISO-8859-1 字符集

对于 0 到 127 的值,8859-1 与 ASCII 相同。8859-1 不使用 128 到 159 之间的值。对于从 160 到 255 的值,8859-1 与 UTF-8 相同。


UTF-8 字符集

对于 0 到 127 的值,UTF-8 与 ASCII 相同。UTF-8 不使用 12 8到 159 之间的值。对于 160 到 255 之间的值,UTF-8 与 ANSI 和 8859-1 相同。UTF-8 从值 256 继续,包含超过 10000 个不同字符。如需深入研究,请阅读我们完整的 HTML 字符集参考手册。


charset CSS 规则

您可以使用 CSS 的charset 规则来指定样式表中使用的字符编码:将样式表的编码设置为 Unicode UTF-8:

  1. @charset "UTF-8";

请在 CSS 参考手册 中获取更多有关 CSS 的charset 规则 的内容。HTML 表情符号HTML URL