博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
UTF-8编码下中文占几个字节
阅读量:6003 次
发布时间:2019-06-20

本文共 266 字,大约阅读时间需要 1 分钟。

hot3.png

 

0

utf8是变长的,不是定长, ucs-4范围是1~6字节, 决定一个utf8字长度得看它首个字符, CJK一般是3字节

2

utf-8是不定长的,根据左侧位1的个数来决定占用了几个字节

false的:

 

utf-8可以根据字的第一个字节移位推出长度的

0xxxxxxx

 

110xxxxx 10xxxxxx

1110xxxx 10xxxxxx 10xxxxxx

11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

转载于:https://my.oschina.net/u/1177694/blog/1619210

你可能感兴趣的文章
关于解决 从相册中选择照片后无法剪切图片以及无法加载图片的问题
查看>>
ubuntu14.04+cuda8.0+caffe+opencv2.4.13+matlab安装指南
查看>>
矩阵图中的广度优先搜索
查看>>
C# 全角和半角转换以及判断的简单代码
查看>>
正则表达式
查看>>
插件推荐系列
查看>>
An introduction to parsing text in Haskell with Parsec
查看>>
Redis在java开发中使用
查看>>
input file样式美化
查看>>
博客园页面设置
查看>>
docker环境搭建
查看>>
开发过程中,ps要做的事情
查看>>
[IOS] Storyboard全解析-第一部分
查看>>
CSS:opacity 的取值范围是 0~1
查看>>
Silverlight 自定义的附加属性
查看>>
常见问题
查看>>
Sqlite插入或更新
查看>>
Jenkins添加Windows自动化构建方案
查看>>
调用天气预报接口
查看>>
node.js中使用http模块创建服务器和客户端
查看>>