基里尔·埃雷门科

作为教育者,没有什么比帮助我们的学生在数据科学中找到自己的道路更令人高兴的了。几个月前,我们向所有社区成员发送了一份调查,询问他们在开始数据科学职业生涯时的担忧。

我们收到了1000多份回复!在将它们分为共同主题时,出现了以下问题:

在我职业生涯的开始,我很想有机会问这些问题。我将为您提供最佳的入门技巧,为您提供大量关于在哪里找工作的想法,并展示如何在没有经验的情况下开始从事数据科学(这并不像您想象的那么不可能!)

数据科学A-Z™: 包括真实生活中的数据科学练习

最后更新日期:2021年9月

  • 217次讲座
  • 各级
4.6 (30,437)

通过实际分析示例逐步学习数据科学。数据挖掘、建模、表格可视化等|由基里尔·埃雷门科(Kirill Eremenko)执笔,Ligency团队

探索课程

为什么我们需要数据科学?

我喜欢回答这个问题——数据科学家总是在寻找商业“为什么”的答案。

为了得出结论,我们需要了解这个领域的实际情况。数据科学包括与数据有关的一切。当你考虑无处不在的数据时,听起来可能很宽泛,但这就是它的本质。

曾几何时,数据科学只能作为其他领域的一个组成部分。多年来,这些领域发展了自己的算法、方法和社区,这些领域使用数据来回答业务问题。但当数据驱动一切时,一门学科的出现只是时间问题。

它已经出现了:这个领域已经经历了严重的增长,正如我们从谷歌趋势搜索词“数据科学”的结果中所看到的:

你自己试试吧. 与所有优秀的数据科学工具一样,您可以过滤您的结果(这里,根据时间、地点、主题类别)。

由于该原则可以应用于任何有数据的地方,并且其原则增加了价值,因此我们可以对业务运营方式产生重大影响。

总结如下:

我们需要数据科学

我在数据科学领域需要做什么?

随着数据科学变得越来越明显,许多人已经注意到了这个领域,但他们仍然对如何访问它感到困惑。好消息是,这个主题是如此之新,以至于目前还没有进入该行业的“标准”方式。

Hadelin de Ponteves和我选择了不同的途径成为数据科学领域的企业家,因此你可能会发现你在我们的一个故事中认识到了自己:

哈德林·德蓬特维斯

哈德林在高中时开始了他的数据科学之旅,当时他对数学产生了热情。谈到选择大学学位,哈德林自然选择了数学。完成本科学位后,哈德林决定他还没有完成这门学科,因此他攻读了数学硕士学位。

哈德林当时在法国的一所工程学校学习是合乎逻辑的。在那里,他在专攻机器学习(ML)和应用数学之前,加深了从数学到经济学、生物学甚至哲学等一系列学科的知识。

为了加强投资组合,Hadelin还利用机会在法国高端有线电视频道Canal+实习,在那里他学到了金融和战略方面的诀窍。最终,哈德林想要的是找到一个既能继续接受教育又能将其理论应用于商业的地方。

研究结束后不久,Hadelin被谷歌收购,在谷歌的商业智能部门担任数据科学家。在谷歌这样的大型企业集团工作给了他在深度学习方面不可估量的经验。但他的目标一直是成为一名企业家,因此Hadelin决定是时候开始为下一代数据科学家制作在线课程了。

他成功的真正关键是什么?哈德林发誓每天吃一大块巧克力!吃大量的巧克力不会让你变成下一个哈德林,但我们从中得到的是让你感到快乐和充满活力。数据科学之旅需要献身精神和技能:途中不要忘记善待自己。

基里尔·埃雷门科

我的故事是从我第一次坐在棋盘前开始的。我喜欢国际象棋,尤其是游戏背后的逻辑和策略。我总是花了很长时间才采取行动,因为我痴迷于分析每一个可能获胜的可能性!

这种早期对逻辑的兴趣吸引了我在大学里学习物理。虽然我很喜欢这门课程,它给了我一些可以在其他地方应用的基础知识,但我在大学毕业后没有继续学习,因为它会把我限制在一个领域。

此外,我一直对以商业为导向的课程表现出兴趣,无论将来会发生什么,这些课程都会更加广泛和多才多艺。正是因为这个原因,我获得了会计学和金融学的硕士学位。这两个主题都是建立创业信心的基础。

尽管如此,我还是很谨慎——我知道要想成功,我需要看看别人是如何做到的。为了获得这些知识,我申请了德勤会计部门的一份工作,并很幸运地得到了这份工作。在我上任的第一天,德勤的一位合伙人看了我的简历,说我非常适合他们的数据科学部门——我凭什么说不?

我发现为德勤工作是对一家专业服务公司如何运作的一项令人着迷的研究,并且能够了解我如何能够在数据科学方面出类拔萃。

虽然德勤可能是许多希望进入该行业的人的金鹅,但不要只为大牌人物而开枪。我在那里有如此丰富的经验,不是因为它是一家知名的跨国公司,而是因为它们让我能够应用我的知识,提高我的技能。这是任何新加入该行业的人都需要超越的——发展的机会。只需选择一个行业,探索其中多种类型的公司。

这就是我在下一份工作中想要的:在我学到的东西的基础上创造和发展。当我被一家养老基金猎头时,他们让我从头开始发展他们的数据科学部门,设计一种方法来帮助其组织在他们的数据上合作,并提供一种不同的客户体验方法。

我在那里工作很愉快,但这让我渴望为他自己工作。一旦他觉得自己准备好了,并且积累了足够的经验,我就跳进了创业领域,开始开设数据科学课程。

总结如下:

数据科学没有单一的途径,所以世界就是你的牡蛎。对我们来说,关键是要确保你在教育和经验之间取得平衡,从而在行业中获得知识和信心,但在何处以及如何获得这些知识和经验则取决于你自己。

从别人的经历中寻找知识,尽可能多地阅读,与你想去的地方的其他人交流,在努力实现自己的数据科学目标的同时享受乐趣!

我怎样才能证明我的工作是可靠的?

随着数据呈指数级增长,我们理所当然地需要更多的数据科学家来开发能够处理数据的工具。这可能让我们相信,从事数据科学的职业不会受到自动化的影响。

然而,这并不是全部——我们越擅长制作工具来处理数据,我们自己的领域就越自动化。有一些机器人可以处理整个数据科学过程,而不需要任何人机交互。

那么,数据科学家会被他们自己的算法所取代吗?

Hadelin和我已经和DataRobot的首席执行官Jeremy Achin讨论过这个问题。Achin和他的团队已经创建了一个自助式ML平台,任何人都可以上传数据供机器处理。这些机器人几乎不是最基本的。它们不仅可以让您从输入的数据中获得见解,还可以帮助您了解需要解决的特定问题。DataRobot是众多自动化数据分析的公司之一。

我们知道这个领域的发展方向,我们不想卖给你任何虚假的梦想,如果你成为一名数据科学家,你的工作将100%安全。保持领先的方法是理解,虽然数据机器人确实可能会淘汰数字运算器,但数据科学也依赖于人们想出新的方法来捕获、存储和处理信息。

机器可能能够更快地完成任务,甚至能够识别任务的最佳解决方案,但它(还)无法为数据科学项目设计出全新的方法。

想一想——遵守规则获得结果是更难,还是找到实现这些结果的全新途径更难?

现在进入这个领域是将自己提升到一个不做“有风险”任务的水平的最佳时机,这样可以保护你免受自动化的威胁。因此,我们能给出的最好建议是专注于增强你的创造力。

对于未来职业的更多洞察,只有一条真正的建议可以遵循:保持好奇心,保持饥饿感,尽可能多地学习。尽管数据浪潮正以这种方式发展,但我们不想让您惊慌,它带来了数百个令人激动的新机会。你只需要做好准备,最好的方法就是马上开始!

总结如下:

机器人将变得更加智能,数据科学也并非完全不受自动化的影响。但我们也需要数据科学家来理解这些机器人、机器人和算法的机制。它们的功能是如何工作的?如何管理它们?我们如何为公司获得可采取行动的产出?我们还需要思考者——能够承担机器无法处理的创造性任务的人。尽早进入游戏,当自动化开始发生时,你会领先很多。

我应该什么时候开始学习数据科学?

考虑到这一领域正处于相对初级阶段,一些人怀疑是否最好等到它长大后再把脚弄湿。如果你读过上一点,你应该知道我们对这个问题的答案:没有比现在更好的时间了。

公司现在开始将数据科学团队引入到他们的组织中——即使是那些核心输出与科学无关的团队!我们生活在一个竞争激烈的世界。精明的公司明白,要想留在游戏中,他们需要一个数据科学团队来深入了解客户和业务运营,从而获得竞争优势,确保他们不会被赶出市场。

这意味着,当一家公司开始使用数据科学时,其竞争对手将别无选择,只能效仿。

随着大多数公司现在创建数据科学团队,更多的机会将会出现。定量紧缩,一份由数据科学领导者IBM委托编写的燃烧玻璃技术报告指出:

据IBM称,到2020年,美国所有数据专业人员的就业机会将增加364000个,达到272000个。

如果我们认为美国的人口接近4亿,这将意味着今年超过一半的美国人口将处于数据科学领域。数据科学工作通常持续45天,这“比市场平均水平长5天”(Burning Glass Technologies,2017)。这意味着公司填补这些职位的难度要高出10%,这告诉我们,目前没有相关人员。

那么,你还在等什么?无论是在教育领域还是在实践领域,现在就进入这个领域,确保你是未来社区的一部分。

总结如下:

有很多方法可以开始,你今天就可以这样做:为什么不参加一门课程,买几本好书,成为一名实习生,练习真实世界的数据集,或者帮助公民科学项目?即使你在这个阶段“只”教育自己,你仍然让自己留在游戏和社区中。如果你只是在等待时机,不要。公司正在寻找你,他们愿意给你丰厚的报酬。

最后更新的网页:2020年4月

数据科学顶级课程

数据科学2021年Python训练营Numpy Pandas&Seaborn
塔赫尔·阿萨夫
4.3 (33)
刚出现的
2021年数据科学课程:完整数据科学训练营
365职业,365职业团队
4.6 (97,185)
畅销书
数据科学和商业分析统计
365职业,365职业团队
4.6 (25,659)
畅销书
2021年完整机器学习与数据科学训练营
安德烈·尼戈伊,丹尼尔·伯克
4.7 (8,377)
数据科学与机器学习(理论+项目)A-Z 90小时
人工智能科学,人工智能科学团队
4.4 (137)
数据科学-项目管理方法-CRISP-DM
360DigiTMG在线学习
4.3 (151)
畅销书
R编程A-Z™: R为数据科学提供真实的练习!
基里尔·埃雷门科,光明队
4.6 (42,605)
畅销书
机器学习、数据科学和Python深度学习
Frank Kane的Sundog教育,Frank Kane,Sundog教育团队
4.7 (25,859)
数据科学与机器学习训练营
何塞·波蒂拉
4.7 (13,755)
最高评级
R编程:数据科学R中的高级分析
基里尔·埃雷门科,光明队
4.7 (7,339)

更多数据科学课程

数据科学学生也会学习

授权你的团队。引领行业。

使用Udemy for Business订阅您所在组织的在线课程和数字学习工具库。

请求演示

基里尔·埃雷门科的课程

数据科学A-Z™: 包括真实生活中的数据科学练习
基里尔·埃雷门科,光明队
4.6 (30,437)
表格访谈问答:数据科学职业表格
基里尔·埃雷门科,光明队
4.2 (440)
R编程A-Z™: R为数据科学提供真实的练习!
基里尔·埃雷门科,光明队
4.6 (42,605)
畅销书
R编程:数据科学R中的高级分析
基里尔·埃雷门科,光明队
4.7 (7,339)
Python A-Z™: Python数据科学与真实练习!
基里尔·埃雷门科,光明队
4.6 (21,850)
Tableau 2020 A-Z:数据科学的实践Tableau培训
基里尔·埃雷门科,光明队
4.6 (71,077)
畅销书
表20高级培训:数据科学大师表
基里尔·埃雷门科,光明队
4.7 (13,556)
机器学习A-Z™: 在数据科学中实践Python&R
Kirill Eremenko,Hadelin de Ponteves,超数据科学支持,Ligency团队
4.5 (150,847)
畅销书
Power BI A-Z:数据科学的Power BI实践培训!
基里尔·埃雷门科,光明队
4.5 (16,908)
数据科学的颜色A-Z:数据可视化颜色理论
基里尔·埃雷门科,帕特里卡·安吉丽卡·杰列涅维奇,宗教团队
4.5 (958)
畅销书
深度学习A-Z™: 人工神经网络
基里尔·埃雷门科、哈德林·德·蓬特维斯、法兰西队
4.6 (38,289)
畅销书
商业分析和数据科学统计A-Z™
基里尔·埃雷门科,光明队
4.6 (8,904)

基里尔·埃雷门科的课程