HTML 编码
HTML 编码,也就是字符集,为了正确显示 HTML 页面,Web 浏览器必须知道要使用哪个字符集。
从 ASCII 到 UTF-8
ASCII 是第一个字符编码标准。ASCII 定义了 128 种可以在互联网上使用的字符:数字(0-9)、英文字母(A-Z)和一些特殊字符,比如:! $ + - ( ) @ < >。ISO-8859-1 是 HTML 4 的默认字符集。此字符集支持 256 个不同的字符代码。HTML 4 同时支持 UTF-8。ANSI(Windows-1252)是原始的 Windows 字符集。 ANSI 与 ISO-8859-1 相同,不同之处在于 ANSI 具有 32 个额外的字符。HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集,该字符集涵盖了世界上几乎所有的字符和符号!
HTML charset 属性
为了正确显示 HTML 页面,Web 浏览器必须了解页面中使用的字符集。这在 <meta> 标签中指定:
<object classid="clsid:F08DF954-8592-11D1-B16A-00C0F0283628" id="Slider1"width="100" height="50"><param name="BorderStyle" value="1" /><param name="MousePointer" value="0" /><param name="Enabled" value="1" /><param name="Min" value="0" /><param name="Max" value="10" /></object>
字符集之间的差异
下表展示了上述字符集之间的区别:
| Numb | ASCII | ANSI | 8859 | UTF-8 | 描述 |
|---|---|---|---|---|---|
| 32 | 空格 | ||||
| 33 | ! | ! | ! | ! | 感叹号 |
| 34 | " | " | " | " | 引号 |
| 35 | # | # | # | # | 数字符号 |
| 36 | $ | $ | $ | $ | 美元符号 |
| 37 | % | % | % | % | 百分号 |
| 38 | & | & | & | & | 连接符 |
| 39 | ' | ' | ' | ' | 撇号 |
| 40 | ( | ( | ( | ( | 左括号 |
| 41 | ) | ) | ) | ) | 右括号 |
| 42 | * | * | * | * | 星号 |
| 43 | + | + | + | + | 加号 |
| 44 | , | , | , | , | 逗号 |
| 45 | - | - | - | - | 减号 |
| 46 | . | . | . | . | 句号 |
| 47 | / | / | / | / | 斜杠 |
| 48 | 0 | 0 | 0 | 0 | 数字 0 |
| 49 | 1 | 1 | 1 | 1 | 数字 1 |
| 50 | 2 | 2 | 2 | 2 | 数字 2 |
| 51 | 3 | 3 | 3 | 3 | 数字 3 |
| 52 | 4 | 4 | 4 | 4 | 数字 4 |
| 53 | 5 | 5 | 5 | 5 | 数字 5 |
| 54 | 6 | 6 | 6 | 6 | 数字 6 |
| 55 | 7 | 7 | 7 | 7 | 数字 7 |
| 56 | 8 | 8 | 8 | 8 | 数字 8 |
| 57 | 9 | 9 | 9 | 9 | 数字 9 |
| 58 | : | : | : | : | 冒号 |
| 59 | ; | ; | ; | ; | 分号 |
| 60 | < | < | < | < | 小于 |
| 61 | = | = | = | = | 等于 |
| 62 | > | > | > | > | 大于 |
| 63 | ? | ? | ? | ? | 问号 |
| 64 | @ | @ | @ | @ | 邮件符号 |
| 65 | A | A | A | A | 拉丁大写字母 A |
| 66 | B | B | B | B | 拉丁大写字母 B |
| 67 | C | C | C | C | 拉丁大写字母 C |
| 68 | D | D | D | D | 拉丁大写字母 D |
| 69 | E | E | E | E | 拉丁大写字母 E |
| 70 | F | F | F | F | 拉丁大写字母 F |
| 71 | G | G | G | G | 拉丁大写字母 G |
| 72 | H | H | H | H | 拉丁大写字母 H |
| 73 | I | I | I | I | 拉丁大写字母 I |
| 74 | J | J | J | J | 拉丁大写字母 J |
| 75 | K | K | K | K | 拉丁大写字母 K |
| 76 | L | L | L | L | 拉丁大写字母 L |
| 77 | M | M | M | M | 拉丁大写字母 M |
| 78 | N | N | N | N | 拉丁大写字母 N |
| 79 | O | O | O | O | 拉丁大写字母 O |
| 80 | P | P | P | P | 拉丁大写字母 P |
| 81 | Q | Q | Q | Q | 拉丁大写字母 Q |
| 82 | R | R | R | R | 拉丁大写字母 R |
| 83 | S | S | S | S | 拉丁大写字母 S |
| 84 | T | T | T | T | 拉丁大写字母 T |
| 85 | U | U | U | U | 拉丁大写字母 U |
| 86 | V | V | V | V | 拉丁大写字母 V |
| 87 | W | W | W | W | 拉丁大写字母 W |
| 88 | X | X | X | X | 拉丁大写字母 X |
| 89 | Y | Y | Y | Y | 拉丁大写字母 Y |
| 90 | Z | Z | Z | Z | 拉丁大写字母 Z |
| 91 | [ | [ | [ | [ | 左方括号 |
| 92 | \ | \ | \ | \ | 反斜杠 |
| 93 | ] | ] | ] | ] | 右方括号 |
| 94 | ^ | ^ | ^ | ^ | 上扬符号 |
| 95 | _ | _ | _ | _ | 下划线 |
| 96 | ` | ` | ` | ` | 抑音符 |
| 97 | a | a | a | a | 拉丁小写字母 a |
| 98 | b | b | b | b | 拉丁小写字母 b |
| 99 | c | c | c | c | 拉丁小写字母 c |
| 100 | d | d | d | d | 拉丁小写字母 d |
| 101 | e | e | e | e | 拉丁小写字母 e |
| 102 | f | f | f | f | 拉丁小写字母 f |
| 103 | g | g | g | g | 拉丁小写字母 g |
| 104 | h | h | h | h | 拉丁小写字母 h |
| 105 | i | i | i | i | 拉丁小写字母 i |
| 106 | j | j | j | j | 拉丁小写字母 j |
| 107 | k | k | k | k | 拉丁小写字母 k |
| 108 | l | l | l | l | 拉丁小写字母 l |
| 109 | m | m | m | m | 拉丁小写字母 m |
| 110 | n | n | n | n | 拉丁小写字母 n |
| 111 | o | o | o | o | 拉丁小写字母 o |
| 112 | p | p | p | p | 拉丁小写字母 p |
| 113 | q | q | q | q | 拉丁小写字母 q |
| 114 | r | r | r | r | 拉丁小写字母 r |
| 115 | s | s | s | s | 拉丁小写字母 s |
| 116 | t | t | t | t | 拉丁小写字母 t |
| 117 | u | u | u | u | 拉丁小写字母 u |
| 118 | v | v | v | v | 拉丁小写字母 v |
| 119 | w | w | w | w | 拉丁小写字母 w |
| 120 | x | x | x | x | 拉丁小写字母 x |
| 121 | y | y | y | y | 拉丁小写字母 y |
| 122 | z | z | z | z | 拉丁小写字母 z |
| 123 | { | { | { | { | 左曲括号 |
| 124 | | | | | | | | | 垂直线 |
| 125 | } | } | } | } | 右曲括号 |
| 126 | ~ | ~ | ~ | ~ | 发音符 |
| 127 | DEL | ||||
| 128 | € | 欧元符号 | |||
| 129 | | | | ||
| 130 | ‚ | 单低 9 引号 | |||
| 131 | ƒ | 拉丁小写字母 f 带勾 | |||
| 132 | „ | 双低 9 引号 | |||
| 133 | … | 省略号 | |||
| 134 | † | 短剑符号 | |||
| 135 | ‡ | 双短剑符号r | |||
| 136 | ˆ | 抑扬音符号 | |||
| 137 | ‰ | 千分之一符号 | |||
| 138 | Š | 拉丁大写字母 S 带加仑 | |||
| 139 | ‹ | 单左指角引号 | |||
| 140 | Œ | 拉丁文大写连字OE | |||
| 141 | | | | 无用 | |
| 142 | Ž | 拉丁大写字母 Z 带加仑 | |||
| 143 | | | | 无用 | |
| 144 | | | | 无用 | |
| 145 | ‘ | 左单引号 | |||
| 146 | ’ | 右单引号 | |||
| 147 | “ | 左双引号 | |||
| 148 | ” | 右双引号 | |||
| 149 | • | 子弹符号 | |||
| 150 | – | 横杠 | |||
| 151 | — | 长横杠 | |||
| 152 | ˜ | 小波形符 | |||
| 153 | ™ | 交易标记符 | |||
| 154 | š | 拉丁小写字母 s 带加仑 | |||
| 155 | › | 单直角引号 | |||
| 156 | œ | 拉丁文小连字oe | |||
| 157 | | | | 无用 | |
| 158 | ž | 拉丁小写字母 z 加仑 | |||
| 159 | Ÿ | 拉丁大写字母 Y 带分音符 | |||
| 160 | 不换行空格 | ||||
| 161 | ¡ | ¡ | ¡ | 倒感叹号 | |
| 162 | ¢ | ¢ | ¢ | 分号 | |
| 163 | £ | £ | £ | 英镑符号 | |
| 164 | ¤ | ¤ | ¤ | 货币符号 | |
| 165 | ¥ | ¥ | ¥ | 日元符号 | |
| 166 | ¦ | ¦ | ¦ | 竖杠 | |
| 167 | § | § | § | 分节符 | |
| 168 | ¨ | ¨ | ¨ | 分音符 | |
| 169 | © | © | © | 版权符 | |
| 170 | ª | ª | ª | 阴性序数记号 | |
| 171 | « | « | « | 左指双角引号 | |
| 172 | ¬ | ¬ | ¬ | ||
| 173 | | | | 软连字符 | |
| 174 | ® | ® | ® | 注册标志 | |
| 175 | ¯ | ¯ | ¯ | 长音符 | |
| 176 | ° | ° | ° | 度 | |
| 177 | ± | ± | ± | 正负号 | |
| 178 | ² | ² | ² | 上标二 | |
| 179 | ³ | ³ | ³ | 上标三 | |
| 180 | ´ | ´ | ´ | 重音符 | |
| 181 | µ | µ | µ | 微标志 | |
| 182 | ¶ | ¶ | ¶ | 段落符号 | |
| 183 | · | · | · | 中间点 | |
| 184 | ¸ | ¸ | ¸ | 下加符 | |
| 185 | ¹ | ¹ | ¹ | 上标一 | |
| 186 | º | º | º | 阳性序数记号 | |
| 187 | » | » | » | 右指双角度引号 | |
| 188 | ¼ | ¼ | ¼ | 四分之一 | |
| 189 | ½ | ½ | ½ | 一半 | |
| 190 | ¾ | ¾ | ¾ | 四分之三 | |
| 191 | ¿ | ¿ | ¿ | 倒问号 | |
| 192 | À | À | À | 拉丁大写字母 A 带沉音符 | |
| 193 | Á | Á | Á | 拉丁大写字母 A 带符号 | |
| 194 | Â | Â | Â | 拉丁大写字母 A 带音调符号 | |
| 195 | Ã | Ã | Ã | 拉丁大写字母 A 带波形号 | |
| 196 | Ä | Ä | Ä | 拉丁大写字母 A 带分音符 | |
| 197 | Å | Å | Å | 拉丁大写字母 A 上面带圈 | |
| 198 | Æ | Æ | Æ | 拉丁大写字母 AE | |
| 199 | Ç | Ç | Ç | 拉丁大写字母 C 带下加符 | |
| 200 | È | È | È | 拉丁大写字母 E 带沉音符 | |
| 201 | É | É | É | 拉丁大写字母 E 带符号 | |
| 202 | Ê | Ê | Ê | 拉丁大写字母 E 带音调符号 | |
| 203 | Ë | Ë | Ë | 拉丁大写字母 E 带分音符 | |
| 204 | Ì | Ì | Ì | 拉丁大写字母 I 带沉音符 | |
| 205 | Í | Í | Í | 拉丁大写字母 I 带符号 | |
| 206 | Î | Î | Î | 拉丁大写字母 I 带音调符号 | |
| 207 | Ï | Ï | Ï | 拉丁大写字母 I 带分音符 | |
| 208 | Ð | Ð | Ð | 拉丁大写字母 Eth | |
| 209 | Ñ | Ñ | Ñ | 拉丁大写字母 N 带波形号 | |
| 210 | Ò | Ò | Ò | 拉丁大写字母 O 带沉音符 | |
| 211 | Ó | Ó | Ó | 拉丁大写字母 O 带符号 | |
| 212 | Ô | Ô | Ô | 拉丁大写字母 O 带音调符号 | |
| 213 | Õ | Õ | Õ | 拉丁大写字母 O 带波形号 | |
| 214 | Ö | Ö | Ö | 拉丁大写字母 O 带分音符 | |
| 215 | × | × | × | 乘号 | |
| 216 | Ø | Ø | Ø | 拉丁大写字母 O 带线条 | |
| 217 | Ù | Ù | Ù | 拉丁大写字母 U 带沉音符 | |
| 218 | Ú | Ú | Ú | 拉丁大写字母 U 带符号 | |
| 219 | Û | Û | Û | 拉丁大写字母 U 带音调符号 | |
| 220 | Ü | Ü | Ü | 拉丁大写字母 U 带分音符 | |
| 221 | Ý | Ý | Ý | 拉丁大写字母 Y 带符号 | |
| 222 | Þ | Þ | Þ | 拉丁大写字母 Thorn | |
| 223 | ß | ß | ß | 拉丁小写字母 sharp s | |
| 224 | à | à | à | 拉丁小写字母 a 带沉音符 | |
| 225 | á | á | á | 拉丁小写字母 a 带符号 | |
| 226 | â | â | â | 拉丁小写字母 a 带音调符号 | |
| 227 | ã | ã | ã | 拉丁小写字母 a 带波形号 | |
| 228 | ä | ä | ä | 拉丁小写字母 a 带分音符 | |
| 229 | å | å | å | 拉丁小写字母 a 上面带圈 | |
| 230 | æ | æ | æ | 拉丁小写字母 ae | |
| 231 | ç | ç | ç | 拉丁小写字母 c 带下加符 | |
| 232 | è | è | è | 拉丁小写字母 e 带沉音符 | |
| 233 | é | é | é | 拉丁小写字母 e 带符号 | |
| 234 | ê | ê | ê | 拉丁小写字母 e 带音调符号 | |
| 235 | ë | ë | ë | 拉丁小写字母 e 带分音符 | |
| 236 | ì | ì | ì | 拉丁小写字母 i 带沉音符 | |
| 237 | í | í | í | 拉丁小写字母 i 带符号 | |
| 238 | î | î | î | 拉丁小写字母 i 带音调符号 | |
| 239 | ï | ï | ï | 拉丁小写字母 i 带分音符 | |
| 240 | ð | ð | ð | 拉丁小写字母 eth | |
| 241 | ñ | ñ | ñ | 拉丁小写字母 n 带波形号 | |
| 242 | ò | ò | ò | 拉丁小写字母 o 带沉音符 | |
| 243 | ó | ó | ó | 拉丁小写字母 o 带符号 | |
| 244 | ô | ô | ô | 拉丁小写字母 o 带音调符号 | |
| 245 | õ | õ | õ | 拉丁小写字母 o 带波形号 | |
| 246 | ö | ö | ö | 拉丁小写字母 o 带分音符 | |
| 247 | ÷ | ÷ | ÷ | 除号 | |
| 248 | ø | ø | ø | 拉丁小写字母 o 带线条 | |
| 249 | ù | ù | ù | 拉丁小写字母 u 带沉音符 | |
| 250 | ú | ú | ú | 拉丁小写字母 u 带符号 | |
| 251 | û | û | û | 拉丁小写字母 u 音调符号 | |
| 252 | ü | ü | ü | 拉丁小写字母 u 带分音符 | |
| 253 | ý | ý | ý | 拉丁小写字母 y 带符号 | |
| 254 | þ | þ | þ | 拉丁小写字母 thorn | |
| 255 | ÿ | ÿ | ÿ | 拉丁小写字母 y 带分音符 |
ASCII 字符集
ASCII 使用 0 到 31(以及 127)之间的值作为控制字符。ASCII 使用 32 到 126 的值表示字母、数字和符号。ASCII 不使用 128 到 255 之间的值。
ANSI 字符集 (Windows-1252)
对于 0 到 127 的值,ANSI 与 ASCII 相同。ANSI 有一组专有的字符,其值从 128 到 159。对于 160 到 255 的值,ANSI 与 UTF-8 相同。
ISO-8859-1 字符集
对于 0 到 127 的值,8859-1 与 ASCII 相同。8859-1 不使用 128 到 159 之间的值。对于从 160 到 255 的值,8859-1 与 UTF-8 相同。
UTF-8 字符集
对于 0 到 127 的值,UTF-8 与 ASCII 相同。UTF-8 不使用 12 8到 159 之间的值。对于 160 到 255 之间的值,UTF-8 与 ANSI 和 8859-1 相同。UTF-8 从值 256 继续,包含超过 10000 个不同字符。如需深入研究,请阅读我们完整的 HTML 字符集参考手册。
charset CSS 规则
您可以使用 CSS 的charset 规则来指定样式表中使用的字符编码:将样式表的编码设置为 Unicode UTF-8:
@charset "UTF-8";
请在 CSS 参考手册 中获取更多有关 CSS 的charset 规则 的内容。HTML 表情符号HTML URL