UTF-8 编码
文本与 UTF-8 字节编码互转
UTF-8(8 位 Unicode 转换格式)是一种针对 Unicode 的可变长度字符编码,也是一种前缀码。它可以用一至四个字节对 Unicode 字符集中的所有有效编码点进行编码,属于 Unicode 标准的一部分。详情参看 百度百科。
编码规则
- ✅ 单字节:ASCII 字符(0x00-0x7F)
- ✅ 双字节:拉丁字母、希腊字母等
- ✅ 三字节:常用汉字
- ✅ 四字节:罕见字符、Emoji
优势
- 🌐 兼容 ASCII
- 🚀 网络传输效率高
- 📦 Web 页面默认编码