Skip to content

TestsLing/s3TableExp

Repository files navigation

数据大屏可视化

随着云计算和大数据技术的不断发展,Amazon S3 已成为最受欢迎的对象存储解决方案。借助其高可扩展性和低成本特性,S3 作为数据湖的核心存储平台,支持各种大数据处理需求。本实验将重点介绍如何在 AWS 上创建 S3 表,并通过集成其他 AWS 服务实现数据存储、处理和分析。

通过本项目,您将学习如何使用 Spark 进行 S3 表存储桶 内数据表的数据操作,实现数据的大屏展示。

功能

基于Amazon S3 Table 数据源实现数据大屏

安装依赖

pip install -r requirements.txt

运行

修改 app.pybucket_arn,修改为我们的表存储桶的 ARN

然后执行以下命令:

spark-submit \
  --packages org.apache.iceberg:iceberg-spark-runtime-3.5_2.12:1.6.1,software.amazon.s3tables:s3-tables-catalog-for-iceberg-runtime:0.1.4,software.amazon.s3tables:s3-tables-catalog-for-iceberg:0.1.4,org.apache.hadoop:hadoop-aws:3.3.1 \
  app.py

示例

alt text

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published