自人类诞生以来,就从未中止过对数据的记录与处理能力的探索。譬如古代对文字、书简、印刷的发明和改进,就可视作是对人类大脑这一单体不可扩展的“原始数据库”进行可用性和扩展性上的弥补。直至计算机问世,让人类拥有了现代意义上的“数据库”,并由此催生了SQL结构化查询语言和关系型数据库。此后几十年里,传统关系型数据库一直牢牢占据着数据库产品的主流,直至云原生数据库的出现。
云原生数据库近年来的快速崛起,实质上体现的是企业对数据能力需求的迭代。数字化进程的不断提速,不仅使数据成为企业核心资产和创新的主要驱动力,也让企业不得不面对数据量指数级暴涨和数据类型及应用场景的多元细分挑战。企业对数据库扩展性和可用性的需求正在变成一条愈发陡峭的曲线,并且早已突破了传统数据库的天花板。
对于数据驱动型的企业来说,具有强大性能、支持多场景需求且具备成本效益的云数据库,已成为打破传统数据库瓶颈,激活数据潜力,实现敏捷高效创新的必选项。这也是为什么越来越多企业选用云数据库的原因。
作为云计算领域的引领者,亚马逊云科技一直致力于探索公有云架构与数据库演进的结合。我们开创性地提出NoSQL概念,并于2012年推出首个云原生数据库Amazon DynamoDB——这一“云原生数据库”从概念到落地应用的里程碑,让我们更加确信“云托管”一定是打破传统数据库瓶颈,进一步激活数据生产力的必然归宿。过去的十几年中,亚马逊云科技在云数据库领域持续创新,不断丰富云数据库的类型与功能,满足企业多样化的业务需求,让企业以更优异的性价比,实现更大化的数据价值。
亚马逊云科技开启数据库云上之旅的第一步,是在传统关系型数据库和SQL语言占据统治地位的时期,就提出了NoSQL概念。这次创新的契机并非“未卜先知”,而是源自我们对传统关系型数据库局限性的亲身感受。
2004年12月的美国零售高峰时段,亚马逊电商使用的商业关系型数据库出现了服务高负载导致的严重扩展失败问题,使官网出现几个小时的服务故障。这促使我们开始思考关系型数据库的局限性:“为什么要为这些工作负载使用关系型数据库?统计数据表明,亚马逊电商业务70%的数据访问只是简单的存储和读取,本质上它并不需要SQL事务级别的复杂性。”
为了解决关系型数据库的可伸缩问题,我们开始着手搭建Amazon Dynamo非关系型数据库原型并撰写论文,提出NoSQL概念,并在2012年推出了第一个云原生非关系型数据库Amazon DynamoDB,以前所未有的方式拥抱了云计算的弹性和可扩展性。
事实证明,NoSQL概念和非关系型数据库的推出,最终成为对数据库演进趋势的一次准确预判。在Amazon DynamoDB问世后的十年里,我们对其进行的持续完善不仅涉及底层可用性、持久性、安全性和规模等特性,还包括易用性等 。现在Amazon DynamoDB已服务于全球众多客户,也包括亚马逊自身。在去年亚马逊长达66小时的Prime会员日大促期间,Amazon DynamoDB以低至个位数毫秒延迟的高性能表现,无感支持峰值达每秒8,920万个请求,同时确保了系统的高可用性。
正如云计算提速了企业数字化的进程,其推广普及也使数据库的迭代与发展进入一个全新的阶段。依托云平台构建、部署和分发的云数据库,天然具有云计算本身的高可达性、可用性和可伸缩性,以及可监控性和高安全性等特征。云计算一方面解决了开源数据库在易用性、可靠性、扩展性、性能等方面的问题,并相比传统商业数据库,降低了高昂的成本。通过云上托管的数据库服务,客户可以用开源数据库实现媲美商业数据库的性能,而成本通常只有商业数据库的若干分之一。
以Amazon Aurora为例,它是与 MySQL 和 PostgreSQL 兼容的关系数据库,专为云而打造。Amazon Aurora具有5 倍于标准MySQL以及3倍于标准PostgreSQL的吞吐性能,而使用成本仅相当于传统商业数据库的十分之一,还可大幅减轻客户运维负担。对于需要最大限度减轻运维工作并增加业务敏捷性的客户,还可以选择无服务器数据库服务,其中Amazon Aurora Serverless可在几分之一秒内自动扩展到数十万个事务,可满足客户最严苛的应用程序,与为峰值负载预置数据库容量的方式相比,该服务可帮助客户节省高达90%的成本。
另外,由于大数据、物联网、机器学习等应用场景的兴起,企业通常需要处理各种类型的数据。云计算赋能下的云数据库则可以解决客户数据类型和数据应用场景多样化的需求。目前,亚马逊云科技提供十多种专门构建的数据库服务,全面覆盖各种数据管理场景和需求,包括关系型数据库Amazon Aurora 及Amazon Relational Database Service(Amazon RDS)、键/值数据库Amazon DynamoDB、文档数据库Amazon DocumentDB(兼容 MongoDB)、内存数据库Amazon ElastiCache 及Amazon MemoryDB for Redis、图数据库Amazon Neptune、时间序列数据库Amazon Timestream、宽列数据库Amazon Keyspaces和分类账数据库Amazon Ledger Database Services (QLDB)。企业在每一个细分应用场景都可以使用最适合的数据库,充分发挥其性能、功能的优势。
写在最后
“数据驱动业务”已成为当下各行各业进行数字化转型的核心目标之一。企业希望数据能更多地取代经验和直觉,在决策、管理、运营和创新的全链路发挥作用,成为真正的“数据驱动型组织”。作为数据处理中枢的数据库,其角色也从IT基础设施上升为企业整体数据战略的关键一环,直接决定了企业能否顺利实现期待中的“用数赋智”。
当云已成为企业数字化建设的新常态,云计算与云原生数据库就如同“一体双生”,让彼此优势获得充分释放,共同推动“数智”能力完成质变。亚马逊云科技相信,云原生数据库是打破固有瓶颈,充分发挥公有云架构优势,释放数据创新潜力的必选项,我们也将持续推动云原生数据库服务的创新,让企业的云上数智之旅愈发得心应手,更加从容地应对未来的创新挑战。