1.1 你所不知道的Excel分析“利器”
Excel简单易用,灵活方便,兼容性强,功能丰富,深受广大使用者的喜欢,一直是职场办公与数据分析人士的生产力工具。但是,Excel常规的功能有时也让人抓狂。例如,单表的行数有限,复杂公式运算缓慢,数据获取与转换难度大,多表关联分析力不从心,等等。
当然,Excel也在不断地改进与更新,以适应大数据时代的办公和数据分析的需要。这里不得不介绍Excel中的两个重要组件。
1)数据获取与清洗——Power Query
Power Query最早是Excel中的一款微软官方的插件,在Excel 2010中以插件的形式进行安装和加载使用,在Excel 2013、Excel 2016、Excel 2019、Excel 2021及最新的Microsoft 365(原Office365)中均属于内置组件。
Power Query(简称PQ)是微软最先在Excel上推出的一款轻型的ETL(Extract-Transform-Load的缩写,即数据获取、转换、上载的过程)工具,即用于数据获取、转换、合并和上载的工具。该工具可以从多种数据源(如Excel工作簿、文件夹、文本/CSV文件、数据库、网络等)中获取数据并进行数据清洗、转换和合并,最后将数据上载到Power Pivot数据模型中或Excel工作表中进行分析。
Power Query的功能十分强大,简单的界面操作就可以完成大量的数据获取与清洗工作,而高级的代码可以完成复杂的数据清洗工作。这些简单易学的功能替代了过去使用复杂的VBA才能完成的工作,是非常值得学习的Excel分析“利器”之一。
2)数据建模与分析——Power Pivot
众所周知,数据透视表的英文是Pivot Table,而Power Pivot则可以被认为是Excel数据透视表的升级。
Power Pivot(简称PP)是微软在Excel上推出的一款用于数据建模和分析的工具,从Excel 2013开始作为Excel中的一个内置加载项来使用。Power Pivot通过对数据进行建模,使用数据分析表达式进行计算后,以数据透视表的方式呈现结果。
Power Pivot是Excel的一个重大的革命性的功能,在一定程度上突破了传统数据透视表的诸多限制。无论是单表独立分析,还是多表关联分析,还是复杂的多维计算,抑或是处理数据的容量等,都是传统的数据透视表所不能比拟的。