原文:
www.kdnuggets.com/2018/11/best-python-ide-data-science.html
作者 Saurabh Hooda,Hackr.io
版权: Hitesh Choudhary 通过 Unsplash
1. Google 网络安全证书 - 快速进入网络安全职业生涯。
2. Google 数据分析专业证书 - 提升你的数据分析技能
3. Google IT 支持专业证书 - 支持你的组织 IT
Python 由 Guido van Rossum 创建,首次发布于 1991 年。这种解释型高级编程语言用于通用编程。Python 解释器可在包括 Linux、MacOS 和 Windows 在内的多个操作系统上使用。
编辑: 这里是最受欢迎的 Python IDE/编辑器,基于 KDnuggets 投票,灵感来源于此博客。
凭借近 30 年的运作历史,Python 在编程社区中赢得了巨大的受欢迎程度。虽然使用 IDLE 或 Python Shell 编写 Python 代码对于小型项目很有效,但在处理完整的机器学习或数据科学项目时却不够实用。
在这种情况下,你需要使用一个 IDE(集成开发环境)或专用的代码编辑器。由于 Python 是领先的编程语言之一,提供了大量的 IDE。因此,问题是,“哪个是最好的 Python IDE?”
显然,没有单一的 Python IDE 或代码编辑器可以被冠以“最佳”称号。这是因为每个 IDE 都有其自身的优点和缺点。此外,在众多的 IDE 中进行选择可能会耗费时间。
不用担心,我们会为你提供帮助。为了帮助你选择合适的 IDE,我们整理了一些主要的 Python IDE,这些 IDE 专为处理数据科学项目而设计。这些 IDE 包括:
平台 – Linux/macOS/Windows
官方网站 – atom.io/
类型 – 通用文本编辑器
Atom 是一个免费的开源文本和源代码编辑器,支持多种编程语言,包括 Java、PHP 和 Python。文本编辑器支持用 Node.js 编写的插件。尽管 Atom 支持多种编程语言,但它对 Python 表现出了特别的热爱,具有有趣的数据科学功能。
Atom 带来的最伟大的特性之一是对 SQL 查询的支持。然而,你需要首先安装 Data Atom 插件才能访问这一功能。它支持 Microsoft SQL Server、MySQL 和 PostgreSQL。此外,你可以在 Atom 中可视化结果,而无需打开其他窗口。
另一个对 Python 数据科学家有利的 Atom 插件是 Markdown Preview Plus。它提供了编辑和可视化 Markdown 文件的支持,让你可以预览、渲染 LaTeX 方程等。
优点:
-
活跃的社区支持
-
与 Git 的极佳集成
-
支持管理多个项目
缺点:
-
在旧版 CPU 上可能会出现性能问题
-
遭遇 迁移问题
平台 – Linux/macOS/Windows
官方网站 – jupyter.org/
类型 – 基于 Web 的 IDE
Jupyter Notebook 源自于 2014 年的 IPython,是一个基于服务器-客户端结构的 Web 应用程序。它允许你创建和操作被称为 notebook 的文档。对于 Python 数据科学家来说,Jupyter Notebook 是必备的,因为它提供了最直观和互动的数据科学环境之一。
除了作为 IDE 操作外,Jupyter Notebook 还可以作为教育或演示工具。此外,它对于刚刚开始数据科学的人员来说是一个完美的工具。你可以轻松查看和编辑代码,制作令人印象深刻的演示文稿。
通过使用 Matplotlib 和 Seaborn 等可视化库,你可以在与代码相同的文档中显示图形。此外,你可以将整个工作导出为 PDF、HTML 或 .py 文件。与 IPython 一样,Project Jupyter 是一系列项目的总称,包括 Notebook 自身、Console 和 Qt 控制台。
优点:
-
允许从笔记本创建博客和演示文稿
-
确保可重复的研究
-
在运行代码之前编辑代码片段
缺点:
- 复杂的安装过程
平台 – Linux/macOS/Windows
官方网站 – www.jetbrains.com/pycharm/
类型 – 专为 Python 设计的 IDE
PyCharm 是一个专为 Python 设计的 IDE。PyCharm 对 Python 就像 Eclipse 对 Java 一样。这个功能全面的集成开发环境提供了免费版和付费版,分别称为 Community 和 Professional 版本。它是安装最快的 IDE 之一,之后的设置也很简单,深受数据科学家青睐。
对于喜欢 IPython 或 Anaconda 发行版的用户,PyCharm 可以轻松集成 Matplotlib 和 NumPy 等工具。这意味着你可以在数据科学项目中轻松使用数组查看器和交互式图。除此之外,IDE 还支持 JavaScript、Angular JS 等。这使得它也适合 Web 开发。
安装完成后,PyCharm 可以直接用于编辑、运行、编写和调试 Python 代码。要开始一个新的 Python 项目,你只需打开一个新文件并开始编写代码。除了提供直接的调试和运行功能外,PyCharm 还支持源代码控制和完整的项目。
优点:
-
活跃的社区支持
-
实际上是 Python 开发的首选,无论是数据科学还是非数据科学项目
-
无论是新手还是资深用户都很容易使用
-
更快的重新索引
-
无需外部要求即可运行、编辑和调试 Python 代码
缺点:
-
可能加载较慢
-
默认设置可能需要调整才能使用现有项目
平台 – Linux/macOS/Windows
官方网站 – rodeo.yhat.com/
类型 – Python 专用 IDE
带有橙色的标志暗示这个 Python IDE 是专门为数据分析开发的。如果你有一些 RStudio 的使用经验,你会知道 Rodeo 与它有许多相似之处。对于不了解 RStudio 的人来说,它是最受欢迎的 R 语言集成开发环境。
像 RStudio 一样,Rodeo 的窗口被分为四个部分,即文本编辑器、控制台、变量可视化环境和绘图/库/文件。令人惊讶的是,Rodeo 和 RStudio 与 MATLAB 有很大相似性。
Rodeo 的最佳之处在于它为初学者和资深用户提供了相同级别的便利。由于 Python IDE 允许你在创建的同时查看和探索,Rodeo 无疑是那些刚开始用 Python 从事数据科学的人最好的 IDE 之一。这个 IDE 还拥有内置教程和辅助材料。
优点:
-
很大的自定义空间
-
实时查看和探索你正在创建的内容
-
通过自动补全和语法高亮功能更快地编写代码,并支持 IPython
缺点:
-
很多错误
-
支持不够活跃
-
存在内存问题
平台 – Linux/macOS/Windows
官方网站 – www.github.com/spyder-ide/spyder
类型 – Python 专用 IDE
Spyder 是一个开源的专用 Python IDE。其独特之处在于它针对数据科学工作流程进行了优化。它配有 Anaconda 包管理器,这是Python 编程语言的标准发行版。Spyder 具备所有必要的 IDE 功能,包括代码自动补全和集成文档浏览器。
专为数据科学项目构建,Spyder 拥有平滑的学习曲线,让你能够迅速上手。在线帮助选项允许你在开发项目的同时查找有关库的具体信息。此外,这款专为 Python 设计的 IDE 与 RStudio 相似。因此,当从 R 转向 Python 时,这是一个不错的选择。
Spyder 对 Python 库(如 Matplotlib 和 SciPy)的集成支持进一步证明了该 IDE 专为数据科学家设计。除了值得称赞的 IPython/Jupyter 集成,Spyder 还具有一个独特的“变量浏览器”功能,允许以表格形式显示数据。
优点:
-
代码自动补全和变量探索
-
易于使用
-
适合数据科学项目使用
-
界面整洁
-
主动的社区支持
缺点:
-
对非数据科学项目能力不足
-
对于高级 Python 开发者来说过于基础
这完全取决于你需要满足的要求。然而,这里有一些通用建议:
-
刚开始使用 Python 时,选择一个自定义和附加功能较少的 IDE。干扰越少,开始得越容易。
-
将 IDE 功能与你的期望进行比较
-
尝试多个 IDE 将帮助你更好地了解哪个最适合特定需求。
个人简介:Saurabh Hooda 曾在全球电信和金融巨头担任多种职务。在 Infosys 和 Sapient 工作十年后,他创建了自己的第一个创业公司 Leno,解决超本地图书共享问题。他对产品营销和分析感兴趣。他最新的项目Hackr.io推荐了最佳的数据科学教程和每种编程语言的在线编程课程。所有教程都由编程社区提交和投票。
相关:
-
数据科学编程最佳实践
-
5 个“干净代码”技巧将显著提高你的生产力
-
初学者数据可视化与探索使用 Pandas