Skip to content

Latest commit

 

History

History
217 lines (109 loc) · 10.5 KB

best-python-ide-data-science.md

File metadata and controls

217 lines (109 loc) · 10.5 KB

最适合数据科学的 Python IDE 是什么?

原文:www.kdnuggets.com/2018/11/best-python-ide-data-science.html

c 评论

作者 Saurabh Hooda,Hackr.io

图片

版权: Hitesh Choudhary 通过 Unsplash


我们的三大课程推荐

1. Google 网络安全证书 - 快速进入网络安全职业生涯。

2. Google 数据分析专业证书 - 提升你的数据分析技能

3. Google IT 支持专业证书 - 支持你的组织 IT


Python 由 Guido van Rossum 创建,首次发布于 1991 年。这种解释型高级编程语言用于通用编程。Python 解释器可在包括 Linux、MacOS 和 Windows 在内的多个操作系统上使用。

编辑: 这里是最受欢迎的 Python IDE/编辑器,基于 KDnuggets 投票,灵感来源于此博客。

凭借近 30 年的运作历史,Python 在编程社区中赢得了巨大的受欢迎程度。虽然使用 IDLE 或 Python Shell 编写 Python 代码对于小型项目很有效,但在处理完整的机器学习或数据科学项目时却不够实用。

在这种情况下,你需要使用一个 IDE(集成开发环境)或专用的代码编辑器。由于 Python 是领先的编程语言之一,提供了大量的 IDE。因此,问题是,“哪个是最好的 Python IDE?”

显然,没有单一的 Python IDE 或代码编辑器可以被冠以“最佳”称号。这是因为每个 IDE 都有其自身的优点和缺点。此外,在众多的 IDE 中进行选择可能会耗费时间。

不用担心,我们会为你提供帮助。为了帮助你选择合适的 IDE,我们整理了一些主要的 Python IDE,这些 IDE 专为处理数据科学项目而设计。这些 IDE 包括:

Atom

平台 – Linux/macOS/Windows

官方网站atom.io/

类型 – 通用文本编辑器

Atom 是一个免费的开源文本和源代码编辑器,支持多种编程语言,包括 Java、PHP 和 Python。文本编辑器支持用 Node.js 编写的插件。尽管 Atom 支持多种编程语言,但它对 Python 表现出了特别的热爱,具有有趣的数据科学功能。

Atom 带来的最伟大的特性之一是对 SQL 查询的支持。然而,你需要首先安装 Data Atom 插件才能访问这一功能。它支持 Microsoft SQL Server、MySQL 和 PostgreSQL。此外,你可以在 Atom 中可视化结果,而无需打开其他窗口。

另一个对 Python 数据科学家有利的 Atom 插件是 Markdown Preview Plus。它提供了编辑和可视化 Markdown 文件的支持,让你可以预览、渲染 LaTeX 方程等。

优点:

  • 活跃的社区支持

  • 与 Git 的极佳集成

  • 支持管理多个项目

缺点:

  • 在旧版 CPU 上可能会出现性能问题

  • 遭遇 迁移问题

Jupyter Notebook

平台 – Linux/macOS/Windows

官方网站jupyter.org/

类型 – 基于 Web 的 IDE

Jupyter Notebook 源自于 2014 年的 IPython,是一个基于服务器-客户端结构的 Web 应用程序。它允许你创建和操作被称为 notebook 的文档。对于 Python 数据科学家来说,Jupyter Notebook 是必备的,因为它提供了最直观和互动的数据科学环境之一。

除了作为 IDE 操作外,Jupyter Notebook 还可以作为教育或演示工具。此外,它对于刚刚开始数据科学的人员来说是一个完美的工具。你可以轻松查看和编辑代码,制作令人印象深刻的演示文稿。

通过使用 Matplotlib 和 Seaborn 等可视化库,你可以在与代码相同的文档中显示图形。此外,你可以将整个工作导出为 PDF、HTML 或 .py 文件。与 IPython 一样,Project Jupyter 是一系列项目的总称,包括 Notebook 自身、Console 和 Qt 控制台。

优点:

  • 允许从笔记本创建博客和演示文稿

  • 确保可重复的研究

  • 在运行代码之前编辑代码片段

缺点:

  • 复杂的安装过程

PyCharm

平台 – Linux/macOS/Windows

官方网站www.jetbrains.com/pycharm/

类型 – 专为 Python 设计的 IDE

PyCharm 是一个专为 Python 设计的 IDE。PyCharm 对 Python 就像 Eclipse 对 Java 一样。这个功能全面的集成开发环境提供了免费版和付费版,分别称为 Community 和 Professional 版本。它是安装最快的 IDE 之一,之后的设置也很简单,深受数据科学家青睐。

对于喜欢 IPython 或 Anaconda 发行版的用户,PyCharm 可以轻松集成 Matplotlib 和 NumPy 等工具。这意味着你可以在数据科学项目中轻松使用数组查看器和交互式图。除此之外,IDE 还支持 JavaScript、Angular JS 等。这使得它也适合 Web 开发。

安装完成后,PyCharm 可以直接用于编辑、运行、编写和调试 Python 代码。要开始一个新的 Python 项目,你只需打开一个新文件并开始编写代码。除了提供直接的调试和运行功能外,PyCharm 还支持源代码控制和完整的项目。

优点:

  • 活跃的社区支持

  • 实际上是 Python 开发的首选,无论是数据科学还是非数据科学项目

  • 无论是新手还是资深用户都很容易使用

  • 更快的重新索引

  • 无需外部要求即可运行、编辑和调试 Python 代码

缺点:

  • 可能加载较慢

  • 默认设置可能需要调整才能使用现有项目

Rodeo

平台 – Linux/macOS/Windows

官方网站rodeo.yhat.com/

类型 – Python 专用 IDE

带有橙色的标志暗示这个 Python IDE 是专门为数据分析开发的。如果你有一些 RStudio 的使用经验,你会知道 Rodeo 与它有许多相似之处。对于不了解 RStudio 的人来说,它是最受欢迎的 R 语言集成开发环境。

像 RStudio 一样,Rodeo 的窗口被分为四个部分,即文本编辑器、控制台、变量可视化环境和绘图/库/文件。令人惊讶的是,Rodeo 和 RStudio 与 MATLAB 有很大相似性。

Rodeo 的最佳之处在于它为初学者和资深用户提供了相同级别的便利。由于 Python IDE 允许你在创建的同时查看和探索,Rodeo 无疑是那些刚开始用 Python 从事数据科学的人最好的 IDE 之一。这个 IDE 还拥有内置教程和辅助材料。

优点:

  • 很大的自定义空间

  • 实时查看和探索你正在创建的内容

  • 通过自动补全和语法高亮功能更快地编写代码,并支持 IPython

缺点:

  • 很多错误

  • 支持不够活跃

  • 存在内存问题

Spyder

平台 – Linux/macOS/Windows

官方网站www.github.com/spyder-ide/spyder

类型 – Python 专用 IDE

Spyder 是一个开源的专用 Python IDE。其独特之处在于它针对数据科学工作流程进行了优化。它配有 Anaconda 包管理器,这是Python 编程语言的标准发行版。Spyder 具备所有必要的 IDE 功能,包括代码自动补全和集成文档浏览器。

专为数据科学项目构建,Spyder 拥有平滑的学习曲线,让你能够迅速上手。在线帮助选项允许你在开发项目的同时查找有关库的具体信息。此外,这款专为 Python 设计的 IDE 与 RStudio 相似。因此,当从 R 转向 Python 时,这是一个不错的选择。

Spyder 对 Python 库(如 Matplotlib 和 SciPy)的集成支持进一步证明了该 IDE 专为数据科学家设计。除了值得称赞的 IPython/Jupyter 集成,Spyder 还具有一个独特的“变量浏览器”功能,允许以表格形式显示数据。

优点:

  • 代码自动补全和变量探索

  • 易于使用

  • 适合数据科学项目使用

  • 界面整洁

  • 主动的社区支持

缺点:

  • 对非数据科学项目能力不足

  • 对于高级 Python 开发者来说过于基础

如何选择最佳的 Python IDE?

这完全取决于你需要满足的要求。然而,这里有一些通用建议:

  • 刚开始使用 Python 时,选择一个自定义和附加功能较少的 IDE。干扰越少,开始得越容易。

  • 将 IDE 功能与你的期望进行比较

  • 尝试多个 IDE 将帮助你更好地了解哪个最适合特定需求。

个人简介:Saurabh Hooda 曾在全球电信和金融巨头担任多种职务。在 Infosys 和 Sapient 工作十年后,他创建了自己的第一个创业公司 Leno,解决超本地图书共享问题。他对产品营销和分析感兴趣。他最新的项目Hackr.io推荐了最佳的数据科学教程和每种编程语言的在线编程课程。所有教程都由编程社区提交和投票。

相关:

  • 数据科学编程最佳实践

  • 5 个“干净代码”技巧将显著提高你的生产力

  • 初学者数据可视化与探索使用 Pandas

更多相关话题