说到数据分析,统计学作为一名数据分析师的核心功底是当之无愧的,因为数据分析的本质也就是统计。但由于如今互联网数据的庞大与复杂,仅仅是用统计学的一些基础理论又是不够的,我们还需要借助一些高级模型来帮助我们解决实际业务中遇到的问题。例如,银行要判断是否给某个客户发放信用卡,这就需要一个高级的二分模型,于是在这里,数据挖掘技术就派上用场了。
在有理论基础的前提下,我们还需要用工具去实现我们的理论并加以应用。在计算机飞速普及的时代,手工计算已经不常见了,于是Python和R就成为数据分析最长用也是最好用的工具。
在这里简略地展示一下成为数据分析师需要掌握的初步知识: 1、统计学基础
2、模型理论
3、Python与R语言 4、网页分析 5、数据库实战技术
说到数据库,就不得不提SQL,对它的熟练掌握也是数据分析师的基本功之一。下面选择其中重要的3点做详细说明:
1. SQL(数据库),我们都知道数据分析师每天都会处理海量的数据,这些数据来源于数据库,那么怎么从数据库取数据?如何建立两表、三表之间的关系?怎么取到自己想要的特定的数据?等等这些数据选择问题就是你首要考虑的问题,而这些问题都是通过SQL解决的,所以SQL是数据分析的最基础的技能; 2. 统计学基础,数据分析的前提要对数据有感知,数据如何收集?数据整体分布是怎样的?如果有时间维度的话随着时间的变化是怎样的?数据的平均值是什么?数据的最大值最小值指什么?数据相关与回归、时间序列分析和预测等等;
3.Python或者R的基础,这一点是必备项也是加分项,在数据挖掘方向是必备项,语言相比较工具更加灵活也更加实用。