作者提供的图片
对于那些希望有效地部署、监控和维护其生产环境中的 ML 模型的人来说,掌握 MLOps(机器学习运维)变得越来越重要。MLOps 是一套旨在融合 ML 系统开发(Dev)和 ML 系统运维(Ops)的实践。幸运的是,开源社区创建了大量资源来帮助初学者掌握这些概念和工具。
1. Google 网络安全证书 - 快速入门网络安全职业
2. Google 数据分析专业证书 - 提升你的数据分析能力
3. Google IT 支持专业证书 - 支持你的组织进行 IT 服务
以下是十个对掌握 MLOps 至关重要的 GitHub 仓库:
GitHub 链接: graviraja/MLOps-Basics
这是一个为期 9 周的学习计划,旨在帮助你掌握与模型监控、配置、数据版本控制、模型打包、Docker、GitHub Actions 和 AWS 云相关的各种概念和工具。你将学习如何构建一个端到端的 MLOps 项目,每周将专注于一个特定主题,以帮助你实现这个目标。
GitHub 链接: microsoft/MLOps
这个仓库提供了 MLOps 的端到端示例和解决方案。它展示了使用 Azure 机器学习实施 ML 工作流的不同端到端场景,并且集成了 GitHub 和其他 Azure 服务,如数据工厂和 DevOps。
GitHub 链接: GokuMohandas/Made-With-ML
如果你在寻找 MLOps 的端到端示例和解决方案,这个仓库可以满足你的需求。它包含了多种场景,展示了如何使用 Azure 机器学习来实现 ML 工作流的运维。此外,它还集成了其他 Azure 服务,如数据工厂和 DevOps,以及 GitHub。
GitHub 链接: Pythondeveloper6/Awesome-MLOPS
该仓库包含各种在线免费资源的链接,这些资源包括 YouTube 视频、职业路线图、需要关注的 LinkedIn 账户、书籍、博客、免费和付费课程、社区、项目和工具。你几乎可以在一个地方找到与 MLOps 相关的所有内容,因此你无需在网上搜索各种信息,只需访问该仓库即可学习。
GitHub 链接: mlops-guide/mlops-guide.github.io
该仓库将带你到一个托管在 GitHub 上的静态网站,帮助项目和公司构建更可靠的 MLOps 环境。它涵盖了 MLOps 的原则、实施指南和项目工作流程。
GitHub 链接: kelvins/awesome-mlops
该仓库包含了一系列 MLOps 工具,可用于 AutoML、机器学习的 CI/CD、Cron 任务监控、数据目录、数据丰富、数据探索、数据管理、数据处理、数据验证、数据可视化、漂移检测、特征工程、特征存储、超参数调整、知识共享、机器学习平台、模型公平性与隐私、模型解释性、模型生命周期、模型服务、模型测试与验证、优化工具、简化工具以及可视分析和调试。
GitHub 链接: SkafteNicki/dtu_mlops
这是 DTU 课程 02476 的一个仓库,其中包括机器学习操作课程的练习和附加材料。课程持续三周,涵盖开发实践、可重复性、自动化、云服务、部署以及监控和扩展等高级主题。
GitHub 链接: GokuMohandas/mlops-course
该课程专注于教授学生如何设计、开发、部署和迭代生产级 ML 应用,使用最佳实践,扩展 ML 工作负载,集成 MLOps 组件,并创建 CI/CD 工作流以实现持续改进和无缝部署。
GitHub 链接: DataTalksClub/mlops-zoomcamp
这是我最喜欢的通过构建项目来学习新概念的课程之一。DataTalks.Club 的 MLOps 课程教授了将机器学习服务投入生产的实际方面,从训练和实验到模型部署和监控。课程旨在帮助数据科学家、ML 工程师、软件工程师和数据工程师学习如何实现机器学习工作流程。
GitHub 链接: featurestoreorg/serverless-ml-course
这门课程专注于开发具有无服务器能力的完整机器学习系统。它允许开发者创建预测服务,而不需要在 Kubernetes 或云计算方面的专业知识。他们可以通过编写 Python 程序和使用无服务器功能、推理管道、特征存储和模型注册表来实现。
掌握 MLOps 对确保机器学习项目在生产中的可靠性、可扩展性和效率至关重要。上述存储库提供了丰富的知识、实用的示例和关键工具,帮助你有效理解和应用 MLOps 原则。无论你是希望入门的新手,还是寻求深化知识的经验丰富的从业者,这些资源都能为你提供宝贵的见解和指导,助你在掌握 MLOps 的旅程中取得成功。
请查看名为 Travis 的 AI 学习平台,它可以帮助你更快地掌握 MLOps 及其概念。Travis 生成关于主题的解释,你可以提出后续问题。此外,它提供了指向 Medium、Substacks、独立博客、官方文档和书籍的顶级出版物上发布的博客和教程的链接,方便你进行自己的研究。
Abid Ali Awan (@1abidaliawan) 是一名认证的数据科学专业人士,他热衷于构建机器学习模型。目前,他专注于内容创作,并撰写关于机器学习和数据科学技术的技术博客。Abid 拥有技术管理硕士学位和电信工程学士学位。他的愿景是利用图神经网络为面临心理健康问题的学生开发 AI 产品。