Khoa học dữ liệu

Các khái niệm cơ bản về khoa học dữ liệu và phân tích dữ liệu

Body
Khoa học dữ liệu là một thuật ngữ bao hàm mọi khía cạnh của xử lý dữ liệu—từ thu thập dữ liệu đến lập mô hình rồi rút ra thông tin chuyên sâu. Mặt khác, phân tích dữ liệu chủ yếu liên quan tới thống kê, toán học và phân tích thống kê.

Tương lai ngành Data Science bứt phá dành cho thế hệ trẻ

Body
Nếu chỉ nghe nói suông về tương lai ngành Data Science trên thế giới sẽ rất phát triển hay Data Scientist sẽ là một trong những nghề nghiệp được tìm kiếm nhiều nhất hiện nay, chắc hẳn không thuyết phục lắm.

Phân tích kết hợp (Conjoint Analysis) là gì?

Body
Phân tích kết hợp là một kỹ thuật thống kê dựa trên khảo sát được sử dụng trong nghiên cứu thị trường giúp xác định cách mọi người đánh giá các thuộc tính khác nhau (tính năng, chức năng, lợi ích) tạo nên một sản phẩm hoặc dịch vụ riêng lẻ.

Thuật toán K-Means với bài toán phân cụm dữ liệu

Body
Phân cụm k-means là 1 phương pháp lượng tử hóa vector dùng để phân các điểm dữ liệu cho trước vào các cụm khác nhau. Phân cụm k-means có nhiều ứng dụng, nhưng được sử dụng nhiều nhất trong Trí tuệ nhân tạo và Học máy.

Metadata là gì? Những lợi ích của Metadata?

Body
Metadata là một thuật ngữ hiện nay được thấy và nghe rất nhiều. Đối với những người đã quen thuộc với tiếng Hy Lạp hoặc Latin thì ý nghĩa của nó có thể không được rõ ràng. Bởi trong những ngôn ngữ này, ‘meta’ được hiểu là sự thay đổi và vị trí. Tuy nhiên ‘meta’ trong Metadata là loại hiện đại, tự tham chiếu hay Metadata chính là dữ liệu về dữ liệu. Nghĩa là dữ liệu dùng để mô tả chính nó, là đối tượng hoặc gói mà nó thuộc về.