SeaTunnel 毕业!首个国人主导的数据集成项目成为 Apache 顶级项目
作者 | InfoQ2023-06-13

北京时间 2023 年 6 月 1 日,全球最大的开源软件基金会 Apache Software Foundation(以下简称 ASF)正式宣布 Apache SeaTunnel 毕业成为 Apache 顶级项目(TLP, Top Level Project)。这是首个由国人主导并贡献到 ASF 的大数据集成领域的顶级项目,这一里程碑的达成标志着 SeaTunnel 在开源软件开发领域的突破,并为其在技术、社区合作和开放创新方面的卓越表现获得了广泛认可。

Apache SeaTunnel 原名 Waterdrop,在 2021 年 10 月更名为 SeaTunnel 并申请加入 Apache 孵化器。目前 Apache SeaTunnel 已发布 40+个版本,并在大量企业生产实践中使用,广泛应用于海量异构数据集成、CDC 数据同步,SaaS 数据集成以及多源数据处理等场景中。

2021 年 12 月 9 日, Apache SeaTunnel 以全票通过的优秀表现正式成为 Apache 孵化器项目。2023 年 5 月 17 日,Apache 董事会通过 Apache SeaTunnel 毕业决议,结束了为期 18 个月的孵化,正式确定 Apache SeaTunnel 成为 Apache 顶级项目。

关于 Apache SeaTunnel

Apache SeaTunnel 是新一代高性能、分布式、海量数据集成工具,支持上百种数据源 ( Database/Cloud/SaaS ) 支持海量数据的实时 CDC 和批量同步,可以稳定高效地同步万亿级数据。

Apache SeaTunnel 技术架构图

作为超高性能分布式数据集成工具,Apache SeaTunnel 整体的特征和优势包括:

  • 支持上百种数据源、传输速度快、准确率高;

  • 降低复杂性,基于 API 开发的连接器能兼容离线同步、实时同步、全量同步、增量同步、CDC 实时同步等多种场景;

  • 简单易用,提供可拖拽和类 SQL 语言界面,节省开发者更多时间 ,提供了作业可视化管理、调度、运行和监控能力。加速低代码和无代码工具的集成 ;

  • 简单易维护,支持单机 & 集群部署,如果选择 SeaTunnel Zeta 引擎部署,无需依赖 Spark、Flink 等大数据组件。

社区发展方面,Apache SeaTunnel 在 ASF 孵化期间,从最开始的几万行代码发展到现在 25 万行代码,共计创建了 2920+ 个 PR,合并 2850+ 个 PR。目前,SeaTunnel 在 GitHub 上 Star 数达 5.1 k+,社区达到 5000+ 人规模,贡献者 180+ 人。

用户方面,Apache SeaTunnel 现已广泛应用于互联网、金融、零售、出行、智能家居、云服务等各行各业中,在海量数据集成、实时异构数据同步、数据聚合以及多源数据聚集等场景中,可高效地处理数万亿条规模以上的数据。

更多信息:

SeaTunnel毕业!首个国人主导的数据集成项目成为Apache顶级项目

本文转载来源:

https://www.infoq.cn/article/5IQEJ5QdztMBKrYDt7yW

热门文章
OpenAI 发布 ChatGPT 近半年,已至少吸引数亿人使用,被大量公司主动嵌入工作流程。很少再有人质疑大型语言模型的价值,并更加笃定行业还有更大、更新的增长机会。
2023-06-13
X