Skip to content

Latest commit

 

History

History
83 lines (42 loc) · 7.48 KB

5-surprising-things-r.md

File metadata and controls

83 lines (42 loc) · 7.48 KB

你可以用 R 做的 5 件令人惊讶的事

原文:www.kdnuggets.com/2022/08/5-surprising-things-r.html

你可以用 R 做的 5 件令人惊讶的事

编辑器提供的图片

R 已经改变了我们处理数据的方式。从数据可视化和分析到机器学习和人工智能,R 在数据科学的众多领域产生了深远的影响。因此,许多数据科学家、分析师和学术专业人士都在使用功能强大的 R 编程语言。


我们的前三大课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。

2. 谷歌数据分析专业证书 - 提升你的数据分析能力

3. 谷歌 IT 支持专业证书 - 支持你的组织在 IT 领域


R 是TIOBE 指数的长期成员,该指数衡量不同编程语言的流行程度,R 被各类专业背景的人士使用。本文将深入探讨 R 的不同用途,并展示你学习这个编程语言后可以做些什么。

1. 创建和定制仪表板和数据可视化

没有数据可视化,几乎无法理解你的数据。数据可视化将你收集和分析的数据转化为易于消化的视觉内容,如图像和图表。这些视觉效果帮助数据科学家和分析师识别数据中难以察觉的趋势。

数据可视化是分析大型数据集时不可或缺的工具,而 R 的 ggplot2 包是其中最优秀的数据可视化工具之一。这个包允许用户绘制几乎任何想要的数据图表,掌握 ggplot2 是充分发挥 R 潜力的一个重要步骤。

你还可以考虑将 ggplot2 包提供的语法与 Plotly 或 Shiny 等工具结合使用。这将使你能够定制数据可视化和仪表板,并使其更具交互性。如果你有一个前端开发人员合作,你可以利用他们的技能使你的视觉效果更具吸引力和易于阅读。同时,也可以考虑探索与 ggplot2、Plotly 和 Shiny 相关的数据可视化课程。

2. 更高级的探索性数据分析

大多数数据科学项目要求在开始其他工作之前进行探索性数据分析。探索性数据分析包括你用来描述数据集的相同步骤。确定不同类型的数据、找到缺失的信息,以及识别值的分布和数据点之间的相关性通常都属于探索性数据分析的范畴。

在使用和掌握 R 时,了解你的数据集包含什么通过探索性数据分析是获取新数据后必不可少的。R 提供了一个名为 "tidyverse" 的套件,包括 tidyr 和 dplyr,允许用户探索、操作和计算数据集。tidyverse 套件具有简单易用的语法,使用户能够快速获得他们想要的答案。

如果你对使用 R 的 tidyverse 套件来探索、操作和计算数据集感兴趣,探索那些深入讲解如何使用 dplyr 和 tidyr 操作数据的课程是个好主意。

3. 执行更具科学严谨性的数据分析

如果你打算学习和掌握 R 编程语言,你需要一种确保你的数据分析具有科学严谨性的方法。统计正是你确保数据分析中存在科学严谨性的关键,而 R 是你可以利用多个统计工具的语言。

在所有可用的编程语言中,R 可能拥有最多专注于统计的工具。R 的工具套件允许你执行各种统计功能。无论你需要获得描述性统计,如标准差和均值,创建映射逻辑回归和线性回归的模型,还是进行 A/B 测试,R 的统计能力确实非常广泛。

想要利用 R 提供的统计能力吗?建议你探索一些介绍统计学、线性回归和逻辑回归以及 A/B 测试的课程。

4. 利用机器学习做出更准确的预测

机器学习无疑是数据科学社区中最广泛讨论的话题之一,也很容易理解原因。机器学习允许数据科学家和分析师自动化地获取重要见解、识别数据模式和开发高精度的预测模型。而且最棒的是?你无需使用明确定义的编程指令即可利用机器学习的强大能力。

在使用 R 编程语言的背景下,机器学习使数据科学家和分析师能够进行准确且广泛的预测。机器学习的核心是通过数据的力量来进行预测的艺术。与统计学一样,R 为用户提供了大量工具,使他们能够运行自己选择的多种机器学习模型。

5. 使用 R Markdown 文档来自动化报告

R Markdown 包在经常生成自动化演示和报告的专业人士中非常受欢迎。为什么会这样?主要是因为 R Markdown 能在文档渲染时运行 R 编写的代码。

Markdown 的扩展,R Markdown 是一种标记语言,它轻量且易于使用。虽然 Markdown 允许用户向文档中添加标题和列表等内容,但 R Markdown 更进一步,处理 R 编程语言。

如果你想知道这为什么重要,请记住,一旦你完成数据分析,你将希望能够报告你的发现。R Markdown 正是你需要的包,用于将你的发现组织成易于理解的报告。它为用户提供了一种易于使用的语法,让他们可以以多种格式创建报告,无论是书面文档、演示文稿还是书籍。

值得注意的是,借助 R Markdown,用户可以在文档中填入与他们进行的复杂计算相关的信息。例如,你可以在由 R Markdown 生成的报告中包括你进行的问卷调查的结果,这些结果考虑了许多受访者的反馈。通过 R Markdown,你可以生成一个包含真实数据的文档,而且既干净又具有视觉吸引力。

结论

R 编程语言在数据科学的几乎每个方面都有专长,它彻底改变了数据科学家和分析师处理数据的方式。一旦掌握了 R,它提供了许多潜在的用途,我们希望我们介绍的五种令人惊讶的 R 使用方式能激励你开始你的学习之旅!

Nahla Davies 是一名软件开发人员和技术作家。在将全部精力投入技术写作之前,她曾担任许多有趣的职位,包括作为一家 Inc. 5,000 实验性品牌机构的首席程序员,该机构的客户包括三星、时代华纳、Netflix 和索尼。

更多相关话题