Base64不是加密算法,只是一种编码办法,数据从一种形式转换为另一种形式进行表示、传输、存储。把原来字节组成的数据按每6位分组,2^6=64,6位比特位打算出数值后,对应出可打印字符。
Base64编码表
例如,在电子邮件的传输中,Base64 可以用来将二进制的字节序列(如附件),编码成基于Base64的ASCII 字节序列进行传输;将一些体积不大的图片 编码Base64 后,直接内嵌到网页源码里;
Base64是一种将 byte数组编码成的字符串只包含ASCII根本字符,用于办理各系统以及传输协议中不兼容的问题而生的。
Base64 编码,分为 4 步:
将原始数据每3个字节Byte作为1组,每个字节Byte是8个位bit,以是一共是 24个位bit;将24个位bit以6位为一组,共分为4组,每组6个bit;在重新分好的每组前面加补00,将6位bit补全8个位bi;末了原始数据的3个字节已经变成4个字节了;编码后的每个字节对应63个字符串的1个;如“Man”字符串Base64编码后便是“TWFu”
字符串“Man”编码
步骤1:01001101 01100001 01101110(原始数据3个字节共24位)
步骤2:010011 010110 000101 101110(以6位1组,划成4组)
步骤3:00010011 00010110 00000101 00101110(每组前面加00,组成一个完全字节)
步骤4:查表,对应TWFu
有时会在Base64字符末端会看到“=”号,1个或2个。Base64编码过程是3个字符一组的进行,如果原文长度不是3的倍数怎么办呢? 例如我们的原文为Ma,它不足3个字节,那么只能在编码后的字符串中补“=”。缺一个字符补一个,缺两个补两个。