HTML 编码
HTML 编码,也就是字符集,为了正确显示 HTML 页面,Web 浏览器必须知道要使用哪个字符集。
从 ASCII 到 UTF-8
ASCII 是第一个字符编码标准。ASCII 定义了 128 种可以在互联网上使用的字符:数字(0-9)、英文字母(A-Z)和一些特殊字符,比如:! $ + - ( ) @ < >。ISO-8859-1 是 HTML 4 的默认字符集。此字符集支持 256 个不同的字符代码。HTML 4 同时支持 UTF-8。ANSI(Windows-1252)是原始的 Windows 字符集。 ANSI 与 ISO-8859-1 相同,不同之处在于 ANSI 具有 32 个额外的字符。HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集,该字符集涵盖了世界上几乎所有的字符和符号!
HTML charset 属性
为了正确显示 HTML 页面,Web 浏览器必须了解页面中使用的字符集。这在 <meta> 标签中指定:
<object classid="clsid:F08DF954-8592-11D1-B16A-00C0F0283628" id="Slider1"
width="100" height="50">
<param name="BorderStyle" value="1" />
<param name="MousePointer" value="0" />
<param name="Enabled" value="1" />
<param name="Min" value="0" />
<param name="Max" value="10" />
</object>
字符集之间的差异
下表展示了上述字符集之间的区别:
Numb | ASCII | ANSI | 8859 | UTF-8 | 描述 |
---|---|---|---|---|---|
32 | 空格 | ||||
33 | ! | ! | ! | ! | 感叹号 |
34 | " | " | " | " | 引号 |
35 | # | # | # | # | 数字符号 |
36 | $ | $ | $ | $ | 美元符号 |
37 | % | % | % | % | 百分号 |
38 | & | & | & | & | 连接符 |
39 | ' | ' | ' | ' | 撇号 |
40 | ( | ( | ( | ( | 左括号 |
41 | ) | ) | ) | ) | 右括号 |
42 | * | * | * | * | 星号 |
43 | + | + | + | + | 加号 |
44 | , | , | , | , | 逗号 |
45 | - | - | - | - | 减号 |
46 | . | . | . | . | 句号 |
47 | / | / | / | / | 斜杠 |
48 | 0 | 0 | 0 | 0 | 数字 0 |
49 | 1 | 1 | 1 | 1 | 数字 1 |
50 | 2 | 2 | 2 | 2 | 数字 2 |
51 | 3 | 3 | 3 | 3 | 数字 3 |
52 | 4 | 4 | 4 | 4 | 数字 4 |
53 | 5 | 5 | 5 | 5 | 数字 5 |
54 | 6 | 6 | 6 | 6 | 数字 6 |
55 | 7 | 7 | 7 | 7 | 数字 7 |
56 | 8 | 8 | 8 | 8 | 数字 8 |
57 | 9 | 9 | 9 | 9 | 数字 9 |
58 | : | : | : | : | 冒号 |
59 | ; | ; | ; | ; | 分号 |
60 | < | < | < | < | 小于 |
61 | = | = | = | = | 等于 |
62 | > | > | > | > | 大于 |
63 | ? | ? | ? | ? | 问号 |
64 | @ | @ | @ | @ | 邮件符号 |
65 | A | A | A | A | 拉丁大写字母 A |
66 | B | B | B | B | 拉丁大写字母 B |
67 | C | C | C | C | 拉丁大写字母 C |
68 | D | D | D | D | 拉丁大写字母 D |
69 | E | E | E | E | 拉丁大写字母 E |
70 | F | F | F | F | 拉丁大写字母 F |
71 | G | G | G | G | 拉丁大写字母 G |
72 | H | H | H | H | 拉丁大写字母 H |
73 | I | I | I | I | 拉丁大写字母 I |
74 | J | J | J | J | 拉丁大写字母 J |
75 | K | K | K | K | 拉丁大写字母 K |
76 | L | L | L | L | 拉丁大写字母 L |
77 | M | M | M | M | 拉丁大写字母 M |
78 | N | N | N | N | 拉丁大写字母 N |
79 | O | O | O | O | 拉丁大写字母 O |
80 | P | P | P | P | 拉丁大写字母 P |
81 | Q | Q | Q | Q | 拉丁大写字母 Q |
82 | R | R | R | R | 拉丁大写字母 R |
83 | S | S | S | S | 拉丁大写字母 S |
84 | T | T | T | T | 拉丁大写字母 T |
85 | U | U | U | U | 拉丁大写字母 U |
86 | V | V | V | V | 拉丁大写字母 V |
87 | W | W | W | W | 拉丁大写字母 W |
88 | X | X | X | X | 拉丁大写字母 X |
89 | Y | Y | Y | Y | 拉丁大写字母 Y |
90 | Z | Z | Z | Z | 拉丁大写字母 Z |
91 | [ | [ | [ | [ | 左方括号 |
92 | \ | \ | \ | \ | 反斜杠 |
93 | ] | ] | ] | ] | 右方括号 |
94 | ^ | ^ | ^ | ^ | 上扬符号 |
95 | _ | _ | _ | _ | 下划线 |
96 | ` | ` | ` | ` | 抑音符 |
97 | a | a | a | a | 拉丁小写字母 a |
98 | b | b | b | b | 拉丁小写字母 b |
99 | c | c | c | c | 拉丁小写字母 c |
100 | d | d | d | d | 拉丁小写字母 d |
101 | e | e | e | e | 拉丁小写字母 e |
102 | f | f | f | f | 拉丁小写字母 f |
103 | g | g | g | g | 拉丁小写字母 g |
104 | h | h | h | h | 拉丁小写字母 h |
105 | i | i | i | i | 拉丁小写字母 i |
106 | j | j | j | j | 拉丁小写字母 j |
107 | k | k | k | k | 拉丁小写字母 k |
108 | l | l | l | l | 拉丁小写字母 l |
109 | m | m | m | m | 拉丁小写字母 m |
110 | n | n | n | n | 拉丁小写字母 n |
111 | o | o | o | o | 拉丁小写字母 o |
112 | p | p | p | p | 拉丁小写字母 p |
113 | q | q | q | q | 拉丁小写字母 q |
114 | r | r | r | r | 拉丁小写字母 r |
115 | s | s | s | s | 拉丁小写字母 s |
116 | t | t | t | t | 拉丁小写字母 t |
117 | u | u | u | u | 拉丁小写字母 u |
118 | v | v | v | v | 拉丁小写字母 v |
119 | w | w | w | w | 拉丁小写字母 w |
120 | x | x | x | x | 拉丁小写字母 x |
121 | y | y | y | y | 拉丁小写字母 y |
122 | z | z | z | z | 拉丁小写字母 z |
123 | { | { | { | { | 左曲括号 |
124 | | | | | | | | | 垂直线 |
125 | } | } | } | } | 右曲括号 |
126 | ~ | ~ | ~ | ~ | 发音符 |
127 | DEL | ||||
128 | € | 欧元符号 | |||
129 | | | | ||
130 | ‚ | 单低 9 引号 | |||
131 | ƒ | 拉丁小写字母 f 带勾 | |||
132 | „ | 双低 9 引号 | |||
133 | … | 省略号 | |||
134 | † | 短剑符号 | |||
135 | ‡ | 双短剑符号r | |||
136 | ˆ | 抑扬音符号 | |||
137 | ‰ | 千分之一符号 | |||
138 | Š | 拉丁大写字母 S 带加仑 | |||
139 | ‹ | 单左指角引号 | |||
140 | Œ | 拉丁文大写连字OE | |||
141 | | | | 无用 | |
142 | Ž | 拉丁大写字母 Z 带加仑 | |||
143 | | | | 无用 | |
144 | | | | 无用 | |
145 | ‘ | 左单引号 | |||
146 | ’ | 右单引号 | |||
147 | “ | 左双引号 | |||
148 | ” | 右双引号 | |||
149 | • | 子弹符号 | |||
150 | – | 横杠 | |||
151 | — | 长横杠 | |||
152 | ˜ | 小波形符 | |||
153 | ™ | 交易标记符 | |||
154 | š | 拉丁小写字母 s 带加仑 | |||
155 | › | 单直角引号 | |||
156 | œ | 拉丁文小连字oe | |||
157 | | | | 无用 | |
158 | ž | 拉丁小写字母 z 加仑 | |||
159 | Ÿ | 拉丁大写字母 Y 带分音符 | |||
160 | 不换行空格 | ||||
161 | ¡ | ¡ | ¡ | 倒感叹号 | |
162 | ¢ | ¢ | ¢ | 分号 | |
163 | £ | £ | £ | 英镑符号 | |
164 | ¤ | ¤ | ¤ | 货币符号 | |
165 | ¥ | ¥ | ¥ | 日元符号 | |
166 | ¦ | ¦ | ¦ | 竖杠 | |
167 | § | § | § | 分节符 | |
168 | ¨ | ¨ | ¨ | 分音符 | |
169 | © | © | © | 版权符 | |
170 | ª | ª | ª | 阴性序数记号 | |
171 | « | « | « | 左指双角引号 | |
172 | ¬ | ¬ | ¬ | ||
173 | | | | 软连字符 | |
174 | ® | ® | ® | 注册标志 | |
175 | ¯ | ¯ | ¯ | 长音符 | |
176 | ° | ° | ° | 度 | |
177 | ± | ± | ± | 正负号 | |
178 | ² | ² | ² | 上标二 | |
179 | ³ | ³ | ³ | 上标三 | |
180 | ´ | ´ | ´ | 重音符 | |
181 | µ | µ | µ | 微标志 | |
182 | ¶ | ¶ | ¶ | 段落符号 | |
183 | · | · | · | 中间点 | |
184 | ¸ | ¸ | ¸ | 下加符 | |
185 | ¹ | ¹ | ¹ | 上标一 | |
186 | º | º | º | 阳性序数记号 | |
187 | » | » | » | 右指双角度引号 | |
188 | ¼ | ¼ | ¼ | 四分之一 | |
189 | ½ | ½ | ½ | 一半 | |
190 | ¾ | ¾ | ¾ | 四分之三 | |
191 | ¿ | ¿ | ¿ | 倒问号 | |
192 | À | À | À | 拉丁大写字母 A 带沉音符 | |
193 | Á | Á | Á | 拉丁大写字母 A 带符号 | |
194 | Â | Â | Â | 拉丁大写字母 A 带音调符号 | |
195 | Ã | Ã | Ã | 拉丁大写字母 A 带波形号 | |
196 | Ä | Ä | Ä | 拉丁大写字母 A 带分音符 | |
197 | Å | Å | Å | 拉丁大写字母 A 上面带圈 | |
198 | Æ | Æ | Æ | 拉丁大写字母 AE | |
199 | Ç | Ç | Ç | 拉丁大写字母 C 带下加符 | |
200 | È | È | È | 拉丁大写字母 E 带沉音符 | |
201 | É | É | É | 拉丁大写字母 E 带符号 | |
202 | Ê | Ê | Ê | 拉丁大写字母 E 带音调符号 | |
203 | Ë | Ë | Ë | 拉丁大写字母 E 带分音符 | |
204 | Ì | Ì | Ì | 拉丁大写字母 I 带沉音符 | |
205 | Í | Í | Í | 拉丁大写字母 I 带符号 | |
206 | Î | Î | Î | 拉丁大写字母 I 带音调符号 | |
207 | Ï | Ï | Ï | 拉丁大写字母 I 带分音符 | |
208 | Ð | Ð | Ð | 拉丁大写字母 Eth | |
209 | Ñ | Ñ | Ñ | 拉丁大写字母 N 带波形号 | |
210 | Ò | Ò | Ò | 拉丁大写字母 O 带沉音符 | |
211 | Ó | Ó | Ó | 拉丁大写字母 O 带符号 | |
212 | Ô | Ô | Ô | 拉丁大写字母 O 带音调符号 | |
213 | Õ | Õ | Õ | 拉丁大写字母 O 带波形号 | |
214 | Ö | Ö | Ö | 拉丁大写字母 O 带分音符 | |
215 | × | × | × | 乘号 | |
216 | Ø | Ø | Ø | 拉丁大写字母 O 带线条 | |
217 | Ù | Ù | Ù | 拉丁大写字母 U 带沉音符 | |
218 | Ú | Ú | Ú | 拉丁大写字母 U 带符号 | |
219 | Û | Û | Û | 拉丁大写字母 U 带音调符号 | |
220 | Ü | Ü | Ü | 拉丁大写字母 U 带分音符 | |
221 | Ý | Ý | Ý | 拉丁大写字母 Y 带符号 | |
222 | Þ | Þ | Þ | 拉丁大写字母 Thorn | |
223 | ß | ß | ß | 拉丁小写字母 sharp s | |
224 | à | à | à | 拉丁小写字母 a 带沉音符 | |
225 | á | á | á | 拉丁小写字母 a 带符号 | |
226 | â | â | â | 拉丁小写字母 a 带音调符号 | |
227 | ã | ã | ã | 拉丁小写字母 a 带波形号 | |
228 | ä | ä | ä | 拉丁小写字母 a 带分音符 | |
229 | å | å | å | 拉丁小写字母 a 上面带圈 | |
230 | æ | æ | æ | 拉丁小写字母 ae | |
231 | ç | ç | ç | 拉丁小写字母 c 带下加符 | |
232 | è | è | è | 拉丁小写字母 e 带沉音符 | |
233 | é | é | é | 拉丁小写字母 e 带符号 | |
234 | ê | ê | ê | 拉丁小写字母 e 带音调符号 | |
235 | ë | ë | ë | 拉丁小写字母 e 带分音符 | |
236 | ì | ì | ì | 拉丁小写字母 i 带沉音符 | |
237 | í | í | í | 拉丁小写字母 i 带符号 | |
238 | î | î | î | 拉丁小写字母 i 带音调符号 | |
239 | ï | ï | ï | 拉丁小写字母 i 带分音符 | |
240 | ð | ð | ð | 拉丁小写字母 eth | |
241 | ñ | ñ | ñ | 拉丁小写字母 n 带波形号 | |
242 | ò | ò | ò | 拉丁小写字母 o 带沉音符 | |
243 | ó | ó | ó | 拉丁小写字母 o 带符号 | |
244 | ô | ô | ô | 拉丁小写字母 o 带音调符号 | |
245 | õ | õ | õ | 拉丁小写字母 o 带波形号 | |
246 | ö | ö | ö | 拉丁小写字母 o 带分音符 | |
247 | ÷ | ÷ | ÷ | 除号 | |
248 | ø | ø | ø | 拉丁小写字母 o 带线条 | |
249 | ù | ù | ù | 拉丁小写字母 u 带沉音符 | |
250 | ú | ú | ú | 拉丁小写字母 u 带符号 | |
251 | û | û | û | 拉丁小写字母 u 音调符号 | |
252 | ü | ü | ü | 拉丁小写字母 u 带分音符 | |
253 | ý | ý | ý | 拉丁小写字母 y 带符号 | |
254 | þ | þ | þ | 拉丁小写字母 thorn | |
255 | ÿ | ÿ | ÿ | 拉丁小写字母 y 带分音符 |
ASCII 字符集
ASCII 使用 0 到 31(以及 127)之间的值作为控制字符。ASCII 使用 32 到 126 的值表示字母、数字和符号。ASCII 不使用 128 到 255 之间的值。
ANSI 字符集 (Windows-1252)
对于 0 到 127 的值,ANSI 与 ASCII 相同。ANSI 有一组专有的字符,其值从 128 到 159。对于 160 到 255 的值,ANSI 与 UTF-8 相同。
ISO-8859-1 字符集
对于 0 到 127 的值,8859-1 与 ASCII 相同。8859-1 不使用 128 到 159 之间的值。对于从 160 到 255 的值,8859-1 与 UTF-8 相同。
UTF-8 字符集
对于 0 到 127 的值,UTF-8 与 ASCII 相同。UTF-8 不使用 12 8到 159 之间的值。对于 160 到 255 之间的值,UTF-8 与 ANSI 和 8859-1 相同。UTF-8 从值 256 继续,包含超过 10000 个不同字符。如需深入研究,请阅读我们完整的 HTML 字符集参考手册。
charset CSS 规则
您可以使用 CSS 的charset 规则来指定样式表中使用的字符编码:将样式表的编码设置为 Unicode UTF-8:
@charset "UTF-8";
请在 CSS 参考手册 中获取更多有关 CSS 的charset 规则 的内容。HTML 表情符号HTML URL