Sự khác biệt giữa kho dữ liệu (Data Warehouse) và chợ dữ liệu (Data Mart)

Kho dữ liệu Warehouse và Data mart được sử dụng làm kho lưu trữ dữ liệu và phục vụ cùng một mục đích. Chúng có thể được phân biệt thông qua số lượng dữ liệu hoặc thông tin họ lưu trữ, và tần suất lấy dữ liệu ra/đẩy dữ liệu vào. Sự khác biệt quan trọng giữa kho dữ liệu và chợ dữ liệu: Warehouse là cơ sở dữ liệu lưu trữ định hướng thông tin để đáp ứng các yêu cầu ra quyết định trong khi Data mart tập trung vào một khu vực chức năng duy nhất của một tổ chức và chứa một tập hợp con dữ liệu được lưu trữ trong Kho dữ liệu.

Data mart thực chất là phiên bản thu gọn của Data warehouse và được thiết kế để sử dụng bởi một bộ phận, đơn vị hoặc nhóm người dùng cụ thể trong một tổ chức. Ví dụ: Tiếp thị, Bán hàng, Nhân sự hoặc tài chính.

Có thể hiểu như Warehouse là chợ đầu mối, còn Data mart như các chợ bán lẻ.

Nói một cách đơn giản, data mart là kho dữ liệu bị giới hạn phạm vi và có thể lấy dữ liệu thông qua việc tóm tắt và chọn dữ liệu từ kho dữ liệu hoặc với sự trợ giúp của quá trình trích xuất, chuyển đổi và tải riêng biệt từ hệ thống dữ liệu nguồn.

Định nghĩa kho dữ liệu Data Warehouse

Kho dữ liệu có nghĩa là một biến thể theo thời gian, hướng đối tượng, không biến đổi và một nhóm dữ liệu tích hợp hỗ trợ quá trình ra quyết định của quản lý. Ngoài ra, nó là một kho thông tin được thu thập từ nhiều nguồn, được lưu trữ trong một lược đồ thống nhất, tại một trang web duy nhất cho phép tích hợp nhiều hệ thống ứng dụng. Một khi dữ liệu này được thu thập, nó được lưu trữ trong một thời gian dài, do đó có tuổi thọ cao và cho phép truy cập vào thông tin lịch sử .

Do đó, kho dữ liệu cung cấp cho người dùng một giao diện tích hợp duy nhất cho dữ liệu thông qua đó người dùng có thể viết các truy vấn hỗ trợ quyết định một cách dễ dàng. Kho dữ liệu giúp biến dữ liệu thành thông tin. Thiết kế một kho dữ liệu bao gồm cách tiếp cận từ trên xuống.

Nó tập hợp thông tin về các chủ đề trải rộng trong toàn bộ tổ chức, chẳng hạn như khách hàng, doanh số, tài sản, vật phẩm, và do đó phạm vi của nó là toàn doanh nghiệp. Nói chung, lược đồ chòm sao thực tế được sử dụng trong nó, bao gồm nhiều đối tượng khác nhau. Kho dữ liệu không phải là một cấu trúc tĩnh và nó đang phát triển liên tục.

Định nghĩa của Data Mart

Một mart dữ liệu có thể được gọi là một tập hợp con của kho dữ liệu hoặc một nhóm phụ của dữ liệu toàn công ty tương ứng với một nhóm người dùng nhất định. Kho dữ liệu liên quan đến một số dữ liệu logic và bộ phận phải liên tục trong minh họa dữ liệu của họ để đảm bảo tính mạnh mẽ của kho dữ liệu. Data mart là một tập hợp các bảng tập trung vào một nhiệm vụ duy nhất, chúng được thiết kế bằng cách sử dụng phương pháp tiếp cận từ dưới lên.

Phạm vi mart dữ liệu được giới hạn trong một số đối tượng được chọn cụ thể, do đó phạm vi của nó là toàn bộ bộ phận. Chúng thường được thực hiện trên các máy chủ bộ phận chi phí thấp . Chu kỳ thực hiện của các dữ liệu được theo dõi trong tuần thay vì tháng và năm.

Mô hình lược đồ hình sao Kimball

Vì lược đồ sao và bông tuyết được hướng tới mô hình chủ đề duy nhất, đó là lý do tại sao chúng thường được sử dụng trong mart dữ liệu. Mặc dù, lược đồ sao phổ biến hơn lược đồ bông tuyết. Tùy thuộc vào nguồn dữ liệu, các dữ liệu có thể được phân thành hai loại: các dữ liệu phụ thuộc và dữ liệu độc lập .


Khác nhau giữa Data Warehouse và Data Mart

Sự khác biệt chính giữa Kho dữ liệu Data Warehouse và Data Mart

  1. Kho dữ liệu là ứng dụng độc lập trong khi data mart dành riêng cho ứng dụng hệ thống hỗ trợ quyết định.
  2. Dữ liệu được lưu trữ trong một kho lưu trữ tập trung duy nhất trong kho dữ liệu. Đối với, dữ liệu mart lưu trữ dữ liệu trong khu vực người dùng.
  3. Kho dữ liệu chứa một dạng dữ liệu chi tiết . Ngược lại, mart dữ liệu chứa dữ liệu tóm tắt và được chọn.
  4. Dữ liệu trong kho dữ liệu hơi không chuẩn hóa trong khi trong trường hợp Data mart thì nó rất không chuẩn hóa.
  5. Việc xây dựng kho dữ liệu liên quan đến cách tiếp cận từ trên xuống . Ngược lại, trong khi xây dựng một mart dữ liệu , cách tiếp cận từ dưới lên được sử dụng.
  6. Kho dữ liệu là tính linh hoạtđịnh hướng thông tin và có tính chất lâu dài. Ngược lại, mart dữ liệu bị hạn chếđịnh hướng dự án và có thời gian tồn tại ngắn hơn.
  7. Lược đồ chòm sao thực tế thường được sử dụng để mô hình hóa kho dữ liệu trong khi đó trong lược đồ sao mart dữ liệu phổ biến hơn.

Kết luận

Kho dữ liệu cung cấp chế độ xem doanh nghiệp, hệ thống lưu trữ đơn và tập trung, kiến ​​trúc vốn có và tính độc lập ứng dụng trong khi Data mart là tập hợp con của kho dữ liệu cung cấp chế độ xem bộ phận, lưu trữ phi tập trung. Data warehouse rất lớn và khi mở rộng sẽ găp nguy cơ thất bại và khó khăn cao trong việc xây dựng nó. Mặt khác, mart dữ liệu rất dễ xây dựng và rủi ro thất bại liên quan cũng ít hơn nhưng mart dữ liệu có nhược điểm là dữ liệu phân mảnh, rời rạc ở nhiều nơi.

Tags