不懂代码?8个技巧教你上手BigQuery

没有程序员背景,没有写过代码的人,也可以学习使用Google BigQuery吗?

答案是肯定的。

同样是代码小白的小编刚开始学习BigQuery时,在许多小问题上走了弯路,所以献上一份针对初学者的Tips list,希望能让你在使用BigQuery时更得心应手。

1 – 保存查询

写完一段查询代码后,可以使用查询窗口下方的“保存查询”按钮进行保存:

当选择保存为“个人”时,该查询只能被自己访问或修改;保存为“项目查询”时,云帐户中的任何人都可以访问或修改它,这种方式非常适合团队合作。

保存查询后,想要再次访问该查询,点击左边菜单栏的“查询历史记录”查找即可:

2 – 保存视图

查询结果可通过“保存结果”以多种形式导出:

或者通过“保存试图”将查询结果存储于数据库中,以便后期频繁使用:

3 – 直接插入表格中的字段名称

在想要查询的表中直接点击“架构”中的字段名称,可自动将所选字段插入我们的查询中。在写代码时,这样做既能使添加多个字段变得简单且快速,也能保证字段名称的准确度。

4 – 导入公共数据集

Google BigQuery中可访问和使用大量公共数据集,我们可以在操作界面菜单左侧“资源”位置选择“浏览公共数据集”,对目标数据集进行添加。

利用外部数据集与自身数据集进行关联分析,不失为新的数据洞察角度。例如,把“covid-19”相关的公共数据集与企业网站的访问量、话题量做关联分析等等。

5 – 一键提高代码的可读性

写代码时一时爽,看代码的人可能就不那么高兴了。

在编写代码时,我们的代码可能是这样的:

点击“展开”里面的“格式”按钮,写好的代码会被安排得明明白白,大大提高了代码可读性:

……

6 – 使用WITH AS语句

进行表格得嵌套时,可使用WITH AS语句创建一个临时表或视图,然后在其中查询。例如:

7 – Group by 1, 2, 3

在GROUP BY子句中,BigQuery将按SELECT语句中的字段名称顺序进行分组,因此可直接用“1,2,3……”调用对应字段,例如:

8 – 使用UNNEST函数

我们知道BigQuery可以和Google Analytics进行数据集成,在BigQuery中可根据需求直接对GA的底层数据进行查询。GA的底层数据以hits级别收集数据,也就是说,在完成了网站的代码部署后,访客每进行一个可被监测到的动作,GA就生成一条数据记录。

因此,BigQuery中表的对象不是采用简单的键值对应,而是包含了简单数据(如字符串,整数和浮点数),和一些复杂数据(如数组,结构甚至结构数组)的。可以理解为以下形式,其中每一个区分开的颜色代表不用的访问,每一个大的分支代表一次hits:

在调用包含复杂数据的字段时,用UNNEST函数可以获取一个数组并将其分解为每个单独的元素。举个简单的例子,如下图所示,GA收取自定义维度相关的数据是以结构数组形式呈现,在调用过程中需要用UNNEST函数进行拍平,拍平前:

使用UNNEST函数:

查询结果:

百闻不如一练,小编刚开始学习BigQuery时对数据结构什么的完全没有概念,通过学习和多多地练习(重点是多多练习),在实践中慢慢积累知识,BigQuery就能变成非常趁手的数据分析工具了。