第2篇 Kubeflow:连接云计算和机器学习的“桥梁”

在前文中,我们简述了当前IT 界的两大“高速列车”——云计算和机器学习,二者相辅相成、相互促进,共同引领IT 技术飞速发展。如何使二者相互结合,从而发挥更大的作用,是近几年IT 界比较热门的话题,各大IT 公司都在试图投入人力和物力来解决这个问题。Kubeflow 正是在这样的大背景下横空出世的。在短短的一年时间内,Kubeflow已经发展成Kubernetes 开源社区中最火热的项目之一,各大IT 巨头纷纷加入了Kubeflow的研发和应用队伍中。

Kubeflow 能够发展这么迅速,主要的原因是它起到了“桥梁”的作用,它强有力地连接起了云计算的标杆技术Kubernetes 和机器学习的各个主流框架(如TensorFlow、PyTorch 等),同时提供了AI 在Kubernetes 云平台上实现端到端的解决方案,给云计算增加了一个重要的应用场景,使机器学习可以更加迅速地发力,大大缩短了机器学习的周期(从数据采集,到模型训练,再到服务发布,从原来的数月缩短到数天,甚至数小时),极大地提高了机器学习的效率,降低了数据科学家和机器学习工程师的维护成本。

这一部分,我们重点讲解Kubeflow。Kubeflow 并不是一种技术,它实际上是一些技术的组合,涉及机器学习的方方面面。