Kirill Eremenko

如果您正在阅读这篇文章,我想您和许多其他数据科学家一样,都想知道应该学习哪种编程语言。无论您是否有使用其他编码工具的经验,这两种工具的单独特性(包括大量的库和包数组)最初可能令人生畏,但是不用担心,我们在这里提供帮助!

没有令人吃惊的是,R和Python都拥有各自的优势,为众多应用,并在其全球社区的专业人士被广泛使用。本文将帮助你决定哪些有合适的工具来走了。

首先,很可能是个好主意,重新审视正是你想要在你的数据科学方面使用的编程语言是什么。For example, a data scientist working predominantly on genetics research may find themselves among those using R (as it’s highly used across genetics and popular with bioinformaticians), whereas someone working on models for image analysis, say an employee at Tesla creating self-driving car technology, might find themselves working with people who prefer Python, due to its sophisticated image manipulation tools. Ultimately, it’s still your choice, and while it would usually never be a good philosophy to just blindly do what everyone else is doing, do take the time to discover why these professionals are preferring certain languages. It is important to be able to “speak” the same language as your future peers.

[R编程A-Z™:R用于数据科学类以实操!

最后更新2020年8月

畅销书
  • 82个讲座
  • 所有级别
4.6 (34628)

学习编程R和r工作室。数据分析,数据科学,统计分析,封装,功能,GGPLOT2 |通过Kirill Eremenko,SuperDataScience团队

探索课程

谁使用R,它的目的是什么?

R最初是作为统计计算的平台创建的,用于承载所有经典测试、时间序列分析、聚类等。它有一个大型的数据挖掘社区,这意味着有大量来自R开发人员和用户的可访问包。在图形方面,有许多用于绘制和分析图形的包和层,比如ggplot2。重要的是,R已经出现在新型人工智能领域,为神经网络、机器学习和贝叶斯推理提供工具,并与MXNet和TensorFlow等深度学习包兼容。你可以在这里了解更多快速有用R包的列表

似乎R不仅拥有大量数据科学家,还拥有大量统计学家和需要数据操纵的相关领域(比如医药、金融和社会科学)的忠实追随者。对于我们数据科学家来说,找到一个广泛使用的程序是很重要的;我们希望能够用一种语言与尽可能多的学科进行交流,使我们的研究成果易于翻译。

谁使用Python,它的目的是什么?

在球场的另一边,Python是全线程序员和开发人员的优秀工具。无论是开发用于模拟生物分子或提供防垃圾邮件软件算法,你会在家里使用其界面和功能阵列发现自己。在1989年发布,它引述是最显著通用的面向对象的编程语言之一。Python有间新的程序员(其中数据科学家),这当然意味着用户和麻烦射手的丰富的社区的不断普及。

同样,在人工智能这个热门话题上,Python也是最受欢迎的选择;它有机器学习、神经网络和张力流工具。此外,对于一些更一般的用途,它的用户可以从库中获益,比如用于统计分析的NumPy、用于数据准备的panda和用于生成地块的seaborn。

řVS的Python:限制

更有趣的部分是:他们各自是如何配对的?尽早发现局限性可能是最重要的建议之一。从经验来说,从使用Matlab,那里是一个巨大的在线支持(通常是一些精彩的人写的一个精确的代码为您的需要),虚拟仪器在那里没有网络,我知道惊慌失措的感觉太好,无法解决这个错误变得沮丧,没有考虑这些明显的潜在的局限性。

一些主要的事情要考虑的数据科学应用是:

让我们来看看这些题目了每个票价。

处理速度:

R被认为是慢的。它要求其对象存储在物理内存中,这意味着在试图利用大数据时,它不是一个很好的选择。话虽如此,更快的处理器正在减少这一限制,并且有各种各样的包致力于解决这一问题。然而,Python更适合于大型数据集,它加载大文件的速度更快。

在线社区:

正如我所提到的,两个R和Python有广泛支持的支持网络,为您接触到,这是有帮助的宝贵来源,这些错误你刚才似乎无法轻易解决。

陡峭的学习曲线:

这可能被认为是或不被认为是R的局限性,但它陡峭的学习曲线是由于它对统计学家的广泛权力。由该领域的专家开发的R是一个不可思议的工具,但您为此付出的代价是最初投入的时间。另一方面,Python因其易用性和相对可访问性对新程序员非常有吸引力。

两个项目都需要你熟悉术语最初似乎艰巨的和混乱的区别(如“包”和“库”),设置的Python在R边缘的用户友好体验,再次链接R统计学家和正在开发的基础在很大程度上依赖其成熟的前任,美国虽然Python对用户的语法要求非常严格,如果您没有遇到容易出错的错误,它就不会运行(尽管从长远来看,这些错误确实增强了用户体验,因为它使我们更好、更简洁地编写代码)。与许多学术用户相比,R有一个可爱的特性,它为用户提供了更多的图形设计控制权,允许各种显示导出和格式。重要的是,两者都是基于解释器的,并且已经发现,相对于其他语言(比如c++),这使得查找错误变得更加容易。

友好的用户界面:

Rstudio被广泛认为是R中最喜欢的接口平台,一旦您开始熟悉它,您就会理解为什么会这样。它被归类为集成开发环境(IDE),包括一个直接执行代码的控制台,以bob外围官网及用于绘图、支持交互式图形、调试和工作区管理的所有功能(参见RStudio IDE功能获取更详细的指南。

Python的主人许多集成开发环境的选择。这样做的好处是,它提供了一个很好的机会,让你选择一个根据你的背景,感觉熟悉。例如,从计算机科学背景的人,Spyder的是一个清楚的喜爱。然而,在该领域的初学者找到PyCharm方便和直观。

广泛使用:

我们已经谈到了这个话题,我要强调的是,这对于你所选择的领域是主观的。如果你倾向于学术、金融、医疗保健等领域,R很可能会被更广泛地使用,你会想要利用这一点。然而,那些对软件开发、自动化或机器人技术感兴趣的人可能会发现自己沉浸在Python社区中。bob外围官网

R vs Python:优势

R:

Python:

考虑到所有这些因素,选择一种语言开始很大程度上取决于你想从中得到什么。如果您是专门从事统计分析或研究工作的数据科学家,您可能会发现R最适合您。但是,如果您看到自己跨多个学科分支,那么您可以利用Python的通用性和多样化的网络。您可能还会同意,随着了解它们各自的优势,最终学习这两种语言(至少能够阅读对方的语法)将对您有好处。这无疑会为你找到工作打开更多的大门,更重要的是,让你清楚地决定你想要的职业道路。但不要不知所措;学习第二种语言会比第一种更容易!毫无疑问,当你成长为一名数据科学家时,你也会发现自己对开放一个全新的社区而感到兴奋。

祝你好运,祝你编程愉快!

在Python热门课程

从零开始学习Python和Ethical Hacking
扎伊德·萨比赫,保安
4.7 (10239)
数据科学:Python的深度学习
懒惰的程序员。
4.6 (6703)
人工智能:Python中的强化学习
Lazy Programmer Team, Lazy Programmer Inc。
4.6 (7653)
畅销书
Python中的自然语言处理和深度学习
懒惰的程序员。
4.5 (5798)
高级AI:深强化学习在Python
Lazy Programmer Team, Lazy Programmer Inc。
4.6 (3366)
深度学习:在Python中卷积神经网络
懒惰的程序员。
4.5 (3037)
畅销书
Python的3:深潜(第1部分 - 功能)
弗雷德·巴蒂斯特
4.8 (4419)
Python中的无监督机器学习隐藏马尔可夫模型
懒惰的程序员。
4.6 (2679)
畅销书
Python中的贝叶斯机器学习:A/B测试
懒惰的程序员。
4.5 (3797)
畅销书
乐团机器学习在Python:随机森林,AdaBoost的
懒惰的程序员。
4.6 (1356)
深度学习先决条件:线性回归在Python
懒惰的程序员。
4.6 (4397)
畅销书

更多Python的课程

Python学生还可以学习

让你的团队。领导行业。

通过Udemy for Business为你的组织订阅在线课程和数字学习工具库。

请求一个演示

通过Kirill Eremenko课程

乐深学习去一个为Z
哈德林·德·庞特维斯,基里尔·埃雷门科,查尔斯·波尔多
4.5 (1963)
畅销书
数据科学A-Z™:包括真实的数据科学练习
基里尔Eremenko,SuperDataScience团队
4.6 (27370)
画面专访Q&A:画面数据对于科学事业
基里尔Eremenko,SuperDataScience团队
4.2 (415)
[R编程A-Z™:R用于数据科学类以实操!
基里尔Eremenko,SuperDataScience团队
4.6 (34628)
畅销书
数据驱动营销A-Z:提高你的活动表现
David Tanaskovic, Kirill Eremenko,超级数据科学团队
4.3 (336)
Z的数据科学
Kirill Eremenko, Hadelin de Ponteves,超级数据科学团队
4.5 (2068)
畅销书
[R编程:高级分析在R有关数据科学
基里尔Eremenko,SuperDataScience团队
4.7 (6102)
Python的A-Z™:Python的数据对于科学有了真正的锻炼!
基里尔Eremenko,SuperDataScience团队
4.6 (17176)
画面2020-Z:动手画面培训数据科学
基里尔Eremenko,SuperDataScience团队
4.6 (53549)
畅销书
Tableau 20高级培训:掌握数据科学中的Tableau
基里尔Eremenko,SuperDataScience团队
4.7 (10807)
机器学习A-Z™:在数据科学中使用Python和R
基里尔Eremenko,Hadelin德蓬特韦,SuperDataScience团队,SuperDataScience支持
4.5 (129554)
畅销书
Power BI A-Z:数据科学的动手Power BI培训!
基里尔Eremenko,SuperDataScience团队
4.4 (9372)

通过Kirill Eremenko课程