原文:
www.kdnuggets.com/2020/01/resources-become-data-engineer.html
评论
数据工程是数据科学从业者中增长最快、需求最旺盛的职业之一。随着我们每天使用越来越多的技术服务,生成的数据量不断增加,快速、高效、有效地收集、存储、查询、清理和处理数据库的能力变得越来越重要。
根据 Statista 的数据,到 2025 年,大数据市场的体量预计将从 2017 年的 26 泽字节增长到 175 泽字节。这代表了从 2017 年到 2025 年 573%的增长。 在 2017 年之前,大数据市场的体量在 2010 到 2016 年间增长了 800%。
1. Google 网络安全证书 - 快速进入网络安全职业生涯。
2. Google 数据分析专业证书 - 提升你的数据分析能力
3. Google IT 支持专业证书 - 支持你的组织的信息技术需求
对于初学者,Dataquest 可能是进入其他资格认证(特别是云认证)之前的一个良好起点。
级别:高级
Azure 数据工程师设计和实施数据管理、监控、安全和隐私,使用完整的 Azure 数据服务堆栈来满足业务需求。该认证是完成多个培训模块后的最终阶段。每个模块培训用户熟练使用 Azure 的产品套件,从而成功成为平台上的数据工程师。每个学习模块少于一天,具体时间取决于每个人的投入,通常不超过 10 小时。
级别:初学者(具有先决条件)
Udacity 数据工程课程是全新的课程,旨在帮助弥补技能差距,满足公司对高级数据库知识及高效可扩展数据处理的需求。课程定于 2020 年 1 月 15 日开始,预计完成时间为 5 个月,每周需要投入 5 小时。
课程内容涉及 SQL、Spark、AWS 上的数据仓库、Apache Airflow 等领域。今天市场上有许多选择,可以在本地或云端创建数据库。
级别:高级
在参加上述认证考试之前,您可能想参加他们推荐的 Qwiklabs 培训课程:Google Cloud Platform 上的数据工程。该培训课程也最适合对云计算有一定了解的人。认证和培训都是短期课程,教您使用 Hadoop、Google BigQuery 和在 GCP 上构建可扩展的机器学习应用程序。
级别:初学者
该课程从 Python 入门,接着学习 SQL,进一步深入到 PostgresSQL 和数据结构与算法的使用。课程内容覆盖广泛,主要围绕 Python 和 SQL。这是一个适合刚入门数据工程领域的课程,但由于课程结构,至少需要具备一些基础的 Python 知识。
级别:初学者
加州大学圣地亚哥分校在 Coursera 上的课程主要围绕使用 Hadoop 框架和 Spark,并在课程最后将这些大数据处理技术应用于机器学习实例。根据课程描述,不需要编程经验。该课程与 Splunk 合作制作。
此课程有特定的硬件和软件要求。
级别:高级
AWS 作为服务和收入最多的云服务提供商,在数据工程领域也将是一个重要的参与者。
AWS 认证大数据 – 专业考试的新版本将于 2020 年 4 月推出,新的名称为 AWS 认证数据分析 – 专业。
因为这个认证面向高级用户,所以需要你有几年使用 AWS 的经验,并持有其他认证,比如 AWS 认证云从业者
级别:中级到高级
安德烈亚斯·克雷茨 创作了这本书,旨在分享他基于数据科学工作流的数据工程知识。他可能更因其播客 数据科学的水管工 而为人熟知,在播客中他讲解和教育我们数据工程的话题。
他在 LinkedIn 上非常活跃,正迅速成为那些希望成为或扩展知识领域的人的重要公众人物。
相关
-
数据科学与数据工程之间的细微差别
-
你需要的最后一本数据分析 SQL 指南
-
帮助准确确定分析工程项目范围的四个问题