D
DevToolBox

UTF-8 编码

文本与 UTF-8 字节编码互转

UTF-8(8 位 Unicode 转换格式)是一种针对 Unicode 的可变长度字符编码,也是一种前缀码。它可以用一至四个字节对 Unicode 字符集中的所有有效编码点进行编码,属于 Unicode 标准的一部分。详情参看 百度百科

编码规则

  • ✅ 单字节:ASCII 字符(0x00-0x7F)
  • ✅ 双字节:拉丁字母、希腊字母等
  • ✅ 三字节:常用汉字
  • ✅ 四字节:罕见字符、Emoji

优势

  • 🌐 兼容 ASCII
  • 🚀 网络传输效率高
  • 📦 Web 页面默认编码