phpcharvarchar区别细说varchar与char有哪些差别

原文链接：https://blog.csdn.net/qq_39390545/article/details/109379218

一、CHAR和VARCHAR有哪些差异1、固定长度 & 可变长度VARCHAR

VARCHAR类型用于存储可变长度字符串，是最常见的字符串数据类型。
它比固定长度类型更节省空间，由于它仅利用必要的空间(根据实际字符串的长度改变存储空间)。

有一种情形例外，如果MySQL表利用ROW_FORMAT=FIXED创建的话，每一行都会利用定长存储。

phpcharvarchar区别细说varchar与char有哪些差别 Vue.js

CHAR

CHAR类型用于存储固定长度字符串：MySQL总是根据定义的字符串长度分配足够的空间。
当存储CHAR值时，MySQL会删除字符串中的末端空格(在MySQL 4.1和更老版本中VARCHAR 也是这样实现的——也便是说这些版本中CHAR和VARCHAR在逻辑上是一样的，差异只是在存储格式上)。

同时，CHAR值会根据须要采取空格进行剩余空间添补，以方便比较和检索。
但正由于其长度固定，以是会霸占多余的空间，也是一种空间换韶光的策略；

2、存储办法VARCHAR

VARCHAR须要利用1或2个额外字节记录字符串的长度：如果列的最大长度小于或即是255字节，则只利用1个字节表示，否则利用2个字节。
假设采取latinl字符集，一个VARCHAR(10)的列须要11个字节的存储空间。
VARCHAR(1000)的列则须要1002 个字节，由于须要2个字节存储长度信息。

VARCHAR节省了存储空间，以是对性能也有帮助。
但是，由于行是变长的，在UPDATE时可能使行变得比原来更长，这就导致须要做额外的事情。
如果一个行占用的空间增长，并且在页内没有更多的空间可以存储，在这种情形下，不同的存储引擎的处理办法是不一样的。
例如，MylSAM会将行拆身分歧的片段存储，InnoDB则须要分裂页来使行可以放进页内。

CHAR

CHAR适宜存储很短或长度近似的字符串。
例如，CHAR非常适宜存储密码的MD5值，由于这是一个定长的值。
对付常常变更的数据，CHAR也比VARCHAR更好，由于定长的CHAR类型不随意马虎产生碎片。
对付非常短的列，CHAR比VARCHAR在存储空间上也更有效率。
例如用CHAR(1)来存储只有Y和N的值，如果采取单字节字符集只须要一个字节，但是VARCHAR(1)却须要两个字节，由于还有一个记录长度的额外字节。

3、存储容量

CHAR

对付char类型来说，最多只能存放的字符个数为255，和编码无关，任何编码最大容量都是255。

VARCHAR

MySQL行默认最大65535字节，是所有列共享（相加）的，以是VARCHAR的最大值受此限定。

表中只有单列字段情形下，varchar一样平常最多能存放(65535 - 3)个字节，varchar的最大有效长度通过最大行数据长度和利用的字符集来确定，常日的最大长度是65532个字符（当字符串中的字符都只占1个字节时，能达到65532个字符）；

为什么是65532个字符？算法如下（有余数时向下取整）：

最大长度(字符数) = （行存储最大字节数 - NULL标识列占用字节数 - 长度标识字节数） / 字符集单字符最大字节数

NULL标识列占用字节数：许可NULL时，占一字节长度标识字节数：记录长度的标识，长度小于即是255（28）时，占1字节；小于65535时（216）,占2字节

VARCHAR类型在4.1和5.0版本发生了很大的变革，使得情形更加繁芜。
从MySQL 4.1开始，每个字符串列可以定义自己的字符集和排序规则。
这些东西会很大程度上影响性能。

4.0版本及以下，MySQL中varchar长度是按字节展示，如varchar(20)，指的是20字节；5.0版本及以上，MySQL中varchar长度是按字符展示。
如varchar(20)，指的是20字符。

当然，行总长度还是65535字节，而字符和字节的换算，则与编码办法有关，不同的字符所占的字节是不同的。
编码划分如下：

GBK编码：一个英笔墨符占一个字节，中文2个字节，单字符最大可占用2个字节。
UTF-8编码：一个英笔墨符占一个字节，中文3个字节，单字符最大可占用3个字节。
utf8mb4编码：一个英笔墨符占一个字节，中文3个字节，单字符最大占4个字节（如emoji表情4字节）。

假设当前还有6字节可以存放字符，按单字符占用最大字节数来算，可以存放3个GBK、或2个utf8、或1个utf8mb4。

思考：既然VARCHAR长度可变，那我要不要定到最大?

没错，相信你已经有答案了，别这么干！

就像利用VARCHAR(5)和VARCHAR(200)存储 '陈哈哈’的磁盘空间开销是一样的。
那么利用更短的列有什么上风呢？

事实证明有很大的上风。
更长的列会花费更多的内存，由于MySQL常日会分配固定大小的内存块来保存内部值。

当然，在没拿到存储引擎存储的数据之前，并不会知道我这一行拿出来的数据到底有多长，可能长度只有1，可能长度是500，那怎么办呢？那就只能先把最大空间分配好了，避免放不下的问题发生，这样实际上对付真实数据较短的varchar确实会造成空间的摧残浪费蹂躏。

举例：我向数据类型为：varchar（1000）的列插入了1024行数据，但是每个只存一个字符，那么这1024行真实数据量实在只有1K，但是我却须要约1M的内存去适应他。
以是最好的策略是只分配真正须要的空间。

二、CHAR和VARCHAR在SQL中须要把稳的点

下面通过一个详细的示例来解释CHAR和VARCHAR类型存储时的差异。
我们创建一张同时存在CHAR(10)字段、VARCHAR(10)字段的表，并且往里面插入一些值来做比拟验证：

-- 建表语句CREATE TABLE `str_table` ( `id` int(11) NOT NULL AUTO_INCREMENT, `str_char` char(10) DEFAULT NULL, `str_varchar` varchar(10) DEFAULT NULL, PRIMARY KEY (`id`)) ENGINE=InnoDB AUTO_INCREMENT=6 DEFAULT CHARSET=utf8mb4;

分别插入一些字符串前面和后面都有空格的示例

-- 插入测试数据INSERT INTO `str_table` (`id`, `str_char`, `str_varchar`) VALUES (null, '陈哈哈', '陈哈哈'),(null, ' 陈哈哈', ' 陈哈哈'),(null, '陈哈哈 ', '陈哈哈 ');

测试数据查询语句如下，通过拼接能更好的看出比拟效果：

-- 测试数据查询select id,concat("|",str_char,"|") as `char`,concat("|",str_varchar,"|") as `varchar` from str_table;

mysql> select id,concat("|",str_char,"|") as `char`,concat("|",str_varchar,"|") as `varchar` from str_table;+----+---------------+---------------+| id | char | varchar |+----+---------------+---------------+| 6 | |陈哈哈| | |陈哈哈| || 7 | | 陈哈哈| | | 陈哈哈| || 8 | |陈哈哈| | |陈哈哈 | |+----+---------------+---------------+3 rows in set (0.00 sec)当检索这些值的时候，会创造id=8行中，char类型的"陈哈哈 "末端的空格被截断了，而VARCHAR(10)字段存储相同的值时，末端的空格被保留了。
其余，id=7行的数据前面空格都被保留了。

可见，CHAR会默认切掉字符串末端的空格，如果须要保留末端的空格，记得用varchar类型！

三、类似的二进制类型：VARBINARY

与CHAR和VARCHAR类似的类型还有BINARY和VARBINARY,它们存储的是二进制字符串。
二进制字符串跟常规字符串非常相似，但是二进制字符串存储的是字节码而不是字符。
添补也不一样：MySQL添补BINARY采取的是\0 (零字节)而不是空格，在检索时也不会去掉添补值。

当须要存储二进制数据，并且希望MySQL利用字节码而不是字符进行比较时，这些类型是非常有用的。
二进制比较的上风并不仅仅表示在大小写敏感上。
MySQL比较BINARY字符串时，每次按一个字节，并且根据该字节的数值进行比较。
因此，二进制比较比字符比较大略很多，以是也就更快。

varchar

varchar是可变长度字符类型，如果对应的数据库排序规则是utf8_general_ci，那么查询的时候将不区分大小写。
如果排序规则是utf8_bin，则会区分大小写。

varbinary

varbinary是二进制字符类型，在排序规则utf8_general_ci下，是可以区分大小写的。