初识ETL及学习计划
来源:互联网 发布:java 从入门到精通 编辑:程序博客网 时间:2024/05/09 18:53
什么是etl?
1. etl的概念
ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。
ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
2.etl需要学习哪些知识?
大学刚毕业,初入公司,本来是java web出生,然而第一份工作被分配到etl搞数据处理。
这是第一次听到etl这么高级的名词,之前是听过数据挖掘,数据分析,云计算这些高大尚的名词,但是也没去学习过。经过一番折磨后,发现etl属于BI(商务智能)的一部分,BI包括数据仓库架构,etl,数据分析,数据挖掘,报表分析等范畴,并且etl跟java开发走的路线完全不一样,至于哪个发展前景好,各有所异。这几天放假,逛了很多csdn博客,论坛,知乎,和贴吧,渐渐对etl有了好感,也略有所了解。下面是个人觉得需要掌握的一些知识以及计划学习的知识:
数据库技术:Oracle, DB2, SQL Server,最好也懂Sybase, My SQL,还包括,SQL,PL/SQL,备份,恢复,调优。(存储过程很重要);
etl工具: Informatica, Datastage, 手工ETL(熟练工具);
报表:Cognos, BO, BIEE, Hyperion….. (未接触过);
操作系统: UNIX或者Linux,AIX, Solaris之类,SHELL脚本等(初级Linux);
HTML, JAVA, JS, JSP,CSS ,AJAX(java web出生,很想继续研究);
熟悉了解一些ERP系统,SAP,Sieble,Salesforce(进阶)。
- 初识ETL及学习计划
- 初识ETL
- 暑期学习计划及目标
- CS学习计划及参考书
- 学习计划及工作总结
- 感想及学习计划
- 每天学习计划及进度汇总
- ETL
- ETL
- ETL
- ETL
- ETL
- ETL
- ETL
- ETL
- ETL
- ETL
- etl
- MySQL 5.6 my.cnf 及其可配置项
- 算法系列(九)平衡二叉查找树AVL树
- 记录Ubuntu & Windows下安装PyV8
- 单链表操作之删除倒数第k个结点
- labview操作者框架
- 初识ETL及学习计划
- Android之数据存储----使用LoaderManager异步加载数据库
- How to Install and Use Python Pip on Ubuntu 14.04 and pip install pytz
- Android Studio教程(四)之AS窗口
- jquery属性选择器应该注意的位置之二
- 读写锁
- Android 获取系统信息
- 说说堆及堆排序
- Genymotion Error in Ubuntu 14.04/ LTS