数据仓库概念:本课程涵盖数据仓库的基本原理,包括 Snowflake、Redshift 和 BigQuery 等平台的架构和用例。它为实施大规模数据存储和处理解决方案奠定了良好的基础。
发展的技能
通过更好地理解数据来了解编写查询的上下文。
处理大型数据集。
了解大数据的概念。
使用数据仓库和大数据工具,例如 Snowflake、Redshift、BigQuery 或 Databricks。
成为一名数据工程师
通过学习高级 Python 成为数据工程师
中级数据工程项目
这些项目侧重于成为更好的程序员和混合不同数据平台等技能。这些技术技能 日本手机数据 对于您为现有技术堆栈做出贡献并作为更大团队的一部分工作的能力至关重要。
项目 4:执行代码审查
该项目涉及审查另一位数据工程师的代码。尽管您可能不像其他项目那样亲身实践技术,但能够审查他人的代码是作为数据工程师成长的重要组成部分。
阅读和审查代码与编写代码一样重要。了解数据工程的基本概念和实践后,您可以将其应用于审查其他人的代码,以确保其遵循最佳实践并减少代码中的潜在错误。
资源
以下是一些有价值的资源,例如项目和文章,可以逐步指导您:
指导项目:
进行代码审查:该指导项目提供实际的代码审查经验,模拟代码审查过程,就像您是高级数据专业人员一样。这是练习识别潜在错误并确保遵循最佳实践的好方法。
文章:
如何进行代码审查:该资源根据丰富的经验提供了有效进行代码审查的建议,并涵盖了审查过程的各个方面。
发展的技能
阅读并评估其他数据工程师编写的代码
检查代码时查找错误和逻辑错误
提供清晰有用的代码反馈
项目5:打造零售数据通道
在此项目中,您将使用沃尔玛零售数据构建完整的 ETL 管道。您将从各种来源(例如 SQL 数据库和 Parquet 文件)检索数据,应用转换技术来准备和清理数据,最后以易于访问的格式加载数据。