对比Excel,轻松学习SQL数据分析
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.5 数据分析工具

1.5.1 Excel与SQL

一般的数据分析都是围绕常规数据分析流程进行的,在这个流程中,我们需要选择合适的工具对数据进行分析。

如果读者对数据库有一些了解,可能觉得数据库是用来存储数据的,而Excel可能是用来进行数据处理的。这两个怎么区分呢?

数据库本身是存储数据的,这个是没有问题的,但是存储的数据一般都是明细类的,或者是杂乱的数据,我们在从数据库获取数据的时候需要对数据进行一系列处理,最后得到我们真正需要的结果数据。

Excel是用来进行数据处理的,这个也是没有问题的,比如,我们在Excel表中对某一列去除重复值,对某两列相加减,这些都是属于数据处理。但是在数据处理之前,Excel中的数据其实也是存储在Excel这个数据库中的。我们可以把一个Excel工作簿本身当作一个数据库,一个Excel工作簿会包含多个Sheet,一个Sheet对应数据库中的一张表,而一个数据库也会包含多张表。

在对数据进行处理之前,数据库和Excel都是用来存储数据的,只不过现在很多互联网公司的数据量太大,使用本地的Excel存储数据已经不能满足日常业务需求,所以数据一般都会存储在数据库中。但是本质原理还是一样的。

在平时工作中,我们一般从数据库中获取数据,对数据进行一些处理变换以后导出到本地,然后在Excel或Python中进行进一步处理。

1.5.2 SQL与Python

虽然SQL可以实现我们在数据分析过程中需要的大部分操作,但是有些操作在SQL中实现起来还是比较烦琐的,这个时候我们就可以使用SQL将数据提取出来,然后导入Python中进行处理。

当然,也可以直接用Python连接SQL,这就省去了导出数据到本地这个过程了,但是一般公司出于安全考虑,是不会直接用Python去连接数据库的。