Big Data
6 thí dụ thực tế về BUSINESS INTELLIGENCE DASHBOARD
- Read more about 6 thí dụ thực tế về BUSINESS INTELLIGENCE DASHBOARD
- Log in or register to post comments
Data-centric và Model-centric khác nhau như thế nào?
- Read more about Data-centric và Model-centric khác nhau như thế nào?
- Log in or register to post comments
Tổng quan về đường dẫn dữ liệu ETL và ELT
- Read more about Tổng quan về đường dẫn dữ liệu ETL và ELT
- Log in or register to post comments
ETL và ELT: Những sự khác biệt cần phải biết
- Read more about ETL và ELT: Những sự khác biệt cần phải biết
- Log in or register to post comments
Khai phá dữ liệu (Data Mining) là gì? Những đặc điểm cần lưu ý
Customer Data Platform (CDP) - Giải pháp quản lý dữ liệu khách hàng tương lai
Tách kho dữ liệu với kỹ thuật Sharding/Data Partitioning
Phân chia dữ liệu (Sharding) là một giải pháp chia nhỏ một Database lớn thành nhiều Database nhỏ, ta có thể phân tách từng bảng hoặc cả một DB ra nhiều phần nhỏ đặt ở nhiều máy chủ (server) khác nhau. Điều này sẽ giúp cho hệ thống DB của chúng ta đạt được các tính chất khả năng bảo trì (manageability), hiệu xuất (performance), tính sẵn sàng (availability), và cân bằng tải (load balancing) của ứng dụng. Và giải pháp này cũng giảm chi phí cũng như tính mở rộng (scalability) để scale up DB bằng cách dùng nhiều server nhỏ gộp lại hơn là nâng cấp một server lớn.
Dòng chảy dữ liệu (Data Pipeline) là gì?
- Read more about Dòng chảy dữ liệu (Data Pipeline) là gì?
- Log in or register to post comments
Data Pipeline là gì?
Một Data Pipeline sẽ thực hiện các nhiệm vụ tổng hợp, sắp xếp và di chuyển dữ liệu đến hệ thống mục tiêu nhằm tiến hành lưu trữ và phân tích. Các Data Pipeline hiện đại tự động hóa quy trình ETL (trích xuất, chuyển đổi, tải) và bao gồm cả nhập liệu, xử lý, lọc, chuyển đổi và di chuyển trên bất kỳ kiến trúc đám mây nào, đồng thời bổ sung thêm các lớp phục hồi chống lại sự cố.