很多传统行业的数据剖析师只哀求节制Excel即可,会SPSS/SAS是加分项。纵然在挖掘满街走,Python不如狗的互联网数据剖析界,Excel也是不可替代的。
Excel是每一个入行的数据剖析师新人必不可少的工具,由于Excel涵盖的功能足够多,如何利用EXCEL进行数据剖析呢?接下来
洗濯处理类
紧张是文本、格式以及脏数据的洗濯。很多数据并不是直接拿来就能用的,须要经由数据剖析职员的清理。数据越多,这个步骤花费的韶光越长。
Trim
打消掉单元格两边的内容,mysql和python都有同名的内置函数,以及ltrim和rtrim的引申用法。
Concatenate
用法:Concatenate(单元格1,单元格2……),合并单元格
例如:concatenate(“我”,”很”,”帅”) = 我很帅,还有另一种合并办法是 &,”我”&”很”&”帅” = 我很帅。当须要合并的内容过多时,concatenate的效率比较快也比较优雅, MySQL有近似函数concat。
Replace
用法:Replace(指定字符串,哪个位置开始更换,更换几个字符,更换成什么)
更换掉单元格的字妇产,洗濯利用较多。可以指定更换字符的起始位置。
Substitute
和replace靠近,差异是更换为全局更换,没有起始位置的观点
Left/Right/Mid
用法:Mid(指定字符串,开始位置,截取长度)
截取字符串中的字符,Left(字符串,截取第几位)。left为从左截取,right为从右截取,mid为从指定位置截取指定长度。
Len/Lenb
返回字符串的长度,在len中,中文打算为一个,在lenb中,中文打算为两个。
Find
用法:Find(要查找字符,指定字符串,第几个字符)
查找某字符串涌现的位置,可以指定为第几次涌现,与Left/Right/Mid结合能完成大略的文本提取。
MySQL中有近似函数 find_in_set,Python中有同名函数。
Search
和find类似,差异是Search大小写不敏感,但支持通配符
Text
讲数值转化为指定的文本格式,可以和韶光序列函数一起看
关联匹配类
在进行多表关联或者行列比对时用到的函数,越繁芜的表用得越多。多说一句,良好的表习气可以减少这类函数的利用。
Lookup
Lookup(查找的值,值所在的位置,返回相应位置的值)
最被忽略的函数,功能性和Vlookup一样,但是引申有数组匹配和二分法。
Vlookup
用法:Vlookup(查找的值,哪里找,找哪个位置的值,是否精准匹配)
Index/Match
用法:Index(查找的区域,区域内第几行,区域内第几列)
和Match组合,媲美Vlookup,但是功能更强大。
Row
返回单元格所在的行
Column
返回单元格所在的列
Offset
用法:Offset(指定点,偏移多少行,偏移多少列,返回多少行,返回多少列)
建立坐标系,以坐标系为原点,返回间隔原点的值或者区域。正数代表向下或向右,负数则相反。
逻辑运算类
数据剖析中不得不用到逻辑运算,后期也会碰着布尔类型,True和False。当然,数据剖析也很磨练逻辑。
1.IF
2.And
3.Or
4.IS系列
5.IF系列
打算统计类
常用的根本剖析统计函数,以描述性统计为准。
1.Sum/Sumif/Sumifs
2.Sumproduct
3.Count/Countif/Countifs
4.Max
5.Min
6.Rank7.Rand/Randbetween8.Averagea9.Quartile10.Stdev11.Substotal12.Int/Round
韶光序列类
专门用户处理韶光格式以及转换
1.Year2.Month3.Weekday4.Weeknum5.Day6.Date7.Now8.Today9.Datedif
函数真是不少,都是数据剖析事情中常用的,快打开你的EXCEL试试吧,勤学勤练,才能闇练于心!