Skip to content

Latest commit

 

History

History
145 lines (73 loc) · 7.87 KB

complete-collection-data-science-projects-part-1.md

File metadata and controls

145 lines (73 loc) · 7.87 KB

数据科学项目完整合集 - 第一部分

原文:www.kdnuggets.com/2022/08/complete-collection-data-science-projects-part-1.html

数据科学项目完整合集 - 第一部分

图片由作者提供

编辑注: 有关本系列 2 部分中包含的所有仓库的完整范围,请参见 数据科学项目完整合集 - 第二部分


我们的前 3 个课程推荐

1. 谷歌网络安全证书 - 快速入门网络安全职业

2. 谷歌数据分析专业证书 - 提升你的数据分析技能

3. 谷歌 IT 支持专业证书 - 支持你的组织 IT


编程

如果你是数据科学新手,编程项目将帮助你熟悉语法、调试和学习新工具。Python、R 和 Julia 主要用于数据处理、数据分析、机器学习和研究项目。

Python

R

Julia

网页抓取

网页抓取是数据工程和数据科学的核心部分,你可以从多个网站收集新的数据,以构建数据集用于数据分析或机器学习任务。一般来说,它用于创建实时数据系统。

数据分析

该分析项目将教你数据清理、处理和可视化的新工具。你将学习如何理解数据并创建具有有价值见解的报告。

SQL

SQL 是创建、管理和流式处理数据库系统的最常用工具。在大多数情况下,你已经运行了一些 SQL 脚本进行分析任务,但将它们集成到你的项目中可能很难想象。这些项目将教你如何使用脚本创建数据库、存储和检索数据,以及如何将它们与其他工具集成。

商业智能

学习使用 BI 工具创建交互式仪表板和分析报告。你将学习如何将小模块结合起来创建仪表板以及它为业务带来的价值。

时间序列

学习理解、处理和可视化时间序列数据。你将学习创建异常检测系统、进行预测并可视化多个图表进行比较。时间序列是数据科学中的一个全新领域,因此将其中一个项目添加到你的作品集中将非常有价值。

结论

在完成几个课程后,你应该立即开始项目。进行项目会提高你对主题的理解,同时也会成为你简历上的一部分。做项目还能提高你的问题解决能力。你将在解决更复杂的问题时学到新的工具和概念。

在这篇博客中,我们学习了编程、网页抓取、数据分析、SQL、商业智能和时间序列项目。你可以通过源代码、教程或 ReadMe 中的初步描述来学习这些项目。关键是你需要复制这些结果。

在下一部分,我们将涵盖:

  1. 机器学习

  2. 深度学习

  3. 计算机视觉

  4. 自然语言处理

  5. 数据工程

  6. MLOps

这是系列中的第 5 版,请查看:

  1. 数据科学备忘单完整合集 – 第一部分 和 第二部分

  2. 数据仓库完整合集 – 第一部分 和 第二部分

  3. 数据科学书籍完整合集 – 第一部分 和 第二部分

  4. 数据科学面试完整合集 – 第一部分 和 第二部分

Abid Ali Awan (@1abidaliawan) 是一位认证的数据科学专业人士,热衷于构建机器学习模型。目前,他专注于内容创作,并撰写关于机器学习和数据科学技术的技术博客。Abid 拥有技术管理硕士学位和电信工程学士学位。他的愿景是使用图神经网络构建一个 AI 产品,帮助那些与心理疾病斗争的学生。

更多相关内容