亚马逊云科技宣布与Hugging Face进一步合作,以加速对大语言模型和视觉模型的训练、精调和部署,促进生成式AI应用的创建。生成式AI应用可以执行各种任务,包括文本摘要、问题回答、代码生成、图像创建以及撰写论文和文章。
亚马逊云科技在生成式AI创新方面拥有深厚历史。例如,亚马逊使用AI技术为Amazon Alexa用户提供对话体验,每周用户互动次数达到数十亿次,同时也越来越多地使用生成式AI来支持新体验,如“Create with Alexa”功能。此外,作为亚马逊搜索(Amazon Search)的一个小组,M5可以帮助亚马逊各地团队将大模型应用到他们的应用程序中,并训练大模型以提升Amazon.com网站的搜索结果。亚马逊云科技持续在机器学习(ML)的所有领域中创新,包括基础设施、Amazon SageMaker相关工具和开箱即用的AI服务,比如Amazon CodeWhisperer,它嵌入到程序员使用的IDE中,通过注释来生成建议代码,以提高开发人员的生产力。为加速机器视觉与大语言模型的训练和推理,亚马逊云科技还推出了自研训练芯片 Amazon Trainium与推理芯片Amazon Inferentia。
Hugging Face之所以选择亚马逊云科技作为首选云供应商,是因为它提供了灵活、可选的全球领先性能工具,例如Amazon SageMaker、Amazon Trainium和Amazon Inferentia,满足了Hugging Face模型训练、精调和部署需求。依赖于此,开发人员使用Hugging Face可以轻松优化性能并降低成本,从而更快地将生成式AI应用投入到生产环境。
“AI的未来已经到来,但并非每个人都能平等享用AI。”Hugging Face首席执行官Clement Delangue表示,“可访问性和透明性是以明智和负责任的方式使用这些新功能,从而共享成果和创造新工具的关键。Amazon SageMaker和亚马逊云科技定制芯片会帮助我们的团队和更大的机器学习社区,将最新研究成果转化为人人都可构建的、公开的可复制模型。”
高性能且兼具成本效益的生成式AI
大语言模型和视觉模型的构建、训练和部署是一个昂贵且耗时的过程,需要深厚的机器学习专业知识的支持。这两类模型非常复杂,可能包含数千亿个参数,因此在很大程度上,许多开发人员无法使用生成式AI。
为了弥补这一差距,Hugging Face与亚马逊云科技建立合作,让开发人员更易通过访问亚马逊云科技的服务,来应用部署Hugging Face模型,尤其是那些生成式AI模型。这样做的好处是:可以更快地训练与扩展低延迟和高通量的推理任务。例如,由Amazon Trainium支持的Amazon Elastic Compute Cloud (Amazon EC2) Trn1实例提供了更快的训练时间,与基于GPU的实例相比,可节省高达50%的训练成本。而由最新一代Amazon Inferentia芯片支持的Amazon EC2 Inf2实例,旨在部署最新一代大语言模型和视觉模型。相比Inf1实例,Inf2 实例吞吐量提升了4倍,延迟降低了10倍。Amazon SageMaker为ML提供工具和工作流,开发人员可以通过Amazon SageMaker等托管服务使用Amazon Trainium和Amazon Inferentia,亦或在Amazon EC2上自行管理。
“生成式AI蕴藏着改变整个行业的巨大潜力,但其成本和所需的专业知识使该技术无法为除少数公司之外的所有公司所用。”亚马逊云科技首席执行官Adam Selipsky表示,“Hugging Face和亚马逊云科技让用户更易访问流行的机器学习模型,以最高的性能和最低的成本创建自己的生成式AI应用。此次合作充分说明,生成式AI公司和亚马逊云科技的合作可以让更多客户对创新技术触手可及。”
即刻开始使用
客户可以通过三种方式在亚马逊云科技平台上调用Hugging Face模型,如使用SageMaker JumpStart、Hugging Face亚马逊云科技深度学习容器( DLC),或者根据教程将已有模型部署到Amazon Trainium或Amazon Inferentia。Hugging Face DLC包含了优化的transformer、数据集和标记器库,使用户将大规模地精调和部署生成式AI应用程序的时间从几周缩短到几小时,并且只需极少的代码更改。SageMaker JumpStart和Hugging Face DLC在提供Amazon SageMaker服务的所有区域上均可使用,无需额外费用。