Etl là gì

Tổng quan tiền ETL

Tiến trình ETL giỏi còn được gọi là các bước thu thập và tích hòa hợp tài liệu (Data Acquisition & Integration).

Bạn đang xem: Etl là gì

Extract (Data Acquisition): truy vấn hệ thống nguồn nhằm trích xuất tài liệu. Dữ liệu được có mặt tự quá trình này gọi là dữ liệu mối cung cấp (Source Data).Transform (Data Integration): bình chọn, làm không bẩn, kiểm soát và điều chỉnh tương xứng những hưởng thụ của DW. Dữ liệu được tạo nên bảo quá trình này Gọi là dữ liệu sở hữu (Load Data).Load (Data Integration): cập nhật DW với dữ liệu được cung cấp từ Load Data.

*

Data Mapping

Data Mapping góp xác định tài liệu nguồn (địa chỉ location, tinh thần state, thời gian timing,…) đáp ứng nhu cầu các thưởng thức dữ liệu của một DW. Các phxay chuyển đổi các thiết nhằm tạo nên các yếu tắc tài liệu vào DW cũng khá được diễn đạt vào phiên bản thứ tài liệu này. Data Mapping có thể được biểu thị nghỉ ngơi dạng bảng tính, biểu đồ vật hoặc vnạp năng lượng bạn dạng.

*

Data Mapping dạng đối kháng giản

*

Business Rule

Qui tắc nghiệp vụ được áp dụng nhằm tạo nên những nguyên tắc kiểm bệnh quality dữu liệu (Data Quality validations) của tài liệu cùng những luồng của chính nó vào DW (luồng ETL, luồng Aggregation). Vì vậy, bất kỳ thành phần tài liệu nào vào DW cần duy trì hành xử độc nhất quán; và nếu hoàn toàn có thể tác động đễn chất lượng nhấn thức của DW, yêu cầu đưa vào list Business Rules.

Xem thêm: Nữ 1979 Mệnh Gì - Sinh Năm 1979 Mệnh Gì

Ví dụ:

*

Kiến trúc ETL

Extract-Transform-Load

*

Trong ứng dụng ETL, data được rước trường đoản cú khối hệ thống hoạt động Operational System. Dữ liệu trích xuất Extracted Data được nắm bắt trên căn nguyên đươc điều khiển vị áp dụng ETL. Tiến trình thâu tóm dữ liệu bên trên nền tảng này được call là Staging. Nền tảng này được Call là Staging Platform hoặc Staging Environment. Tại thời đặc điểm này, Staged Data sinh hoạt dạng thô raw, giống như thể thức và tinh thần của nó trong ứng dụng hoạt đông. Trước quy trình Transsize, Staged Data được Hotline là Source Data.

Ứng dụng Transform thực thi các phiến đổi khác dữ liệu cần thiết bên trên Source Data để gia công nó cân xứng với các qui tắc, bố cục tổng quan và format vào DW. Transformed Data vẫn được được thâu tóm vào Staging Platform. Tuy nhiên, sau thời điểm Transsize, Staged Data được điện thoại tư vấn là Load Data.

Ứng dụng Load là cầu nối khoảng cách giãu ETL/Staging PlatformDW Platform. Ứng dụng Load đọc Load Data và tiến hành các bước INSERT, UPDATE, DELETE bên trên DW. khi vận dụng Load thành công, ETL kết thúc.

Extract-Load-Transform

*

Sự khác biệt giữa áp dụng ETL với ELT là nền tảng gốc rễ plakhung nhưng mà áp dụng triển khai chức năng của chính nó.

Xem thêm: Neut Là Gì ? Chỉ Số Neut Trong Máu Là Gì

Ứng dụng ELT áp dụng nền tảng ELT như một căn cơ trong thời điểm tạm thời để liên kết tới căn cơ DW RDBMS. Nền tảng ELT trích xuất tài liệu vận động, cài thẳng vào những Staging Table trên căn cơ DW RDBMS. Tất cả chức năng Transkhung được tiến hành bên trên gốc rễ này. Cuối thuộc, DW được tải trường đoản cú bên phía trong căn nguyên DW RDBMS.

Nguyên ổn lý xây đắp ETL

Process principles:

One Thing at a TimeKnow when to lớn BeginKnow when khổng lồ EndLarge to lớn Medium lớn SmallStage Data IntegrityKnow what you have

Stage principles:


Chuyên mục: Công Nghệ 4.0