高薪的数据科学家,为什么多数人选择离职?

我是一位数据科学家,也很热爱这份工作,但不得不承认的是,虽然数据科学被称为是21世纪最性感的工作,但事实上它并没有那么完美。

此前有个调查数据显示,数据科学家们每周会花费1-2小时寻找新工作。

为什么大家会处于这样的状态中?

在继续往下进行之前,先说明一点,我并不是想要阻拦谁成为数据科学家,只是想让有意愿者能够更为全面的看待它。

数据科学有它的优势,但在现实情况中也存在一些问题。

这些就是我认为造成数据科学家离职的原因。

期望与现实不符

“每个人都在谈论大数据,但没人真正知道如何做,每个人都认为其他人正在做,所以都声称自己正在做……”

这句话再贴切不过了。我认识的很多初级数据科学家,想从事数据科学这个领域是因为可以使用机器学习算法去解决复杂问题,会对业务产生较大的影响,这份工作在我们看来,比之前做的任何工作都重要。

但事实并非如此。

在我看来,期望与现实不符是很多数据科学家决定离职的重要原因之一。

造成这种情况的原因有很多,每个公司都不尽相同,以我自己经历的或者看到的来说,公司在没有合适的基础架构的情况下雇用数据科学家,并且也没有雇用有经验的数据从业者,这将会导致在项目运行过程中产生不少的问题,甚至是冲突。

还有一些公司,对数据科学家的要求就是整理数据基础架构或者创建分析报告,相比使用机器学习算法来驱动洞察力,公司只想要一张每天可以在会议上展示的图表。但之后,公司又会为没有及时得到数据中的价值而失望。

以上种种会让数据科学家对工作感到不满意。

所以,这里给初级数据科学家一个建议:评估理想与自己所处环境的关键路径的契合度。比如一家媒体出版社,核心业务里机器算法重要性偏低,从事数据科学可能只会带来很小的增量收益。

企业和数据科学家之间是双向关系,如果公司内部数据团队的位置以及目标,与你作为数据科学家的目标不一致,那么离开就只是一个时间问题。

决策至上

“数据科学家花费80%的时间来获取,清理和管理数据,而剩下的时间则用于分析和机器学习”。如果仅考虑在工作产出上花费的时间,这就是对的。但现实情况则是需要花很多的时间去说服管理者,以避免犯一些比较低级的数据错误。

很多公司会认为自己是数据驱动并且具有一定的数据素养,实际则是,你会发现大部分的数据都存储在电子表格中,没有人部署日志解析器,并且要访问数据库,就需要花费很多时间去跟IT部门沟通。

有的公司为了“贴”上数据驱动的标签,可能会想要收集所有的数据。

但事实上,为了让管理层不断了解数据科学的工作,就需要不断的做一些决策者安排的工作,比如从数据库中获取数据,以便在合适的时间提供给合适的人,进行一些简单的项目,从而获得认同。

如果你觉得掌握很多的机器学习算法会成为最有价值的数据科学家,请回到第一点:期望与现实不符。

数据全能者——可以处理任何数据

在企业里面,管理层常常不理解“数据科学家”的含义。

这意味着什么?

你将既是分析专家又是报告专家,还是数据库专家。

不仅是非技术主管会这么认为,其他技术同事也会默认你知道所有与数据相关的信息。你会使用Spark,Hadoop,Hive,Pig,SQL,Neo4J,MySQL,Python,R,Scala,Tensorflow,A/B测试,NLP,任何机器学习去解决数据相关的问题。

(顺便提一下,如果看到一份写着所有这些内容的工作说明,要清楚这是一家不知道自己的数据战略是什么的公司,他们认为雇用任何数据相关的人就可以解决所有的数据问题)。

但向对方解释自己真正掌握的技能很困难,不是因为其他人会忽视你,而是作为经验较少的初级数据科学家,会担心他们忽略自己,这很麻烦。

在孤立的团队中工作

当我们看到成功的数据产品时,经常会看到专业且智能的用户界面,最重要的是,这是一个有价值的输出,可以让用户感知到正在帮助他们解决相关的问题。

而如今,如果数据科学家仅将时间花在学习如何编写和执行机器学习算法上,那他们只构成团队的一小部分,处于基础层去协助开发有价值产品的项目取得成功。

这意味着独立工作的数据科学团队将难以提供更多的价值。

尽管如此,许多公司依然组建数据科学团队,由他们提出独立的项目并编写代码去尝试解决问题。在某些情况下,这足够了。举个简单的例子,比如需要一个季度生成一次静态电子表格。

但从另一个角度看,如果目的是为定制的网站产品开发提供明智的优化建议,那么这将涉及许多不同的技能,绝大多数的数据科学家难以应对,只有在数据科学领域达到一定专业度的人才能解决此类问题。

因此,如果该项目由独立的数据科学团队执行,则很可能失败,或者会花费很长的时间,在大型企业中组织独立的团队推进协作项目的难度会比较大。

成为行业里高价值的数据科学家,不仅需要专业知识过硬,也需要了解企业的团队结构以及数据文化。

就如上文所提到过的,在寻找数据科学工作的时候,找到那些关键步骤与你保持一致的企业是主要目的。同时,可能还需要重新调整对数据科学角色的期望。

最后,祝好~希望我没有打击到你的信心。

原文链接:

https://towardsdatascience.com/why-so-many-data-scientists-are-leaving-their-jobs-a1f0329d7ea4,有所删减以及修改,版权归原作者所有。

发表评论

邮箱地址不会被公开。 必填项已用*标注