Tổng quan về Sematic Web thế hệ 3.0 (Web ngữ nghĩa)

Semantic Web (hay Web có ngữ nghĩa) là thế hệ mở rộng của Web hiện tại được đưa ra bởi Tim Berners-Lee vào khoảng năm 1998. Mục tiêu ban đầu của Semantic Web là để hỗ trợ người dùng tìm kiếm thông tin trên mạng một cách nhanh chóng, chuẩn xác và thông minh hơn so với các công cụ tìm kiếm truyền thống.


Kể từ đó đến nay, các kỹ thuật liên quan đến Semantic Web không ngừng được hoàn thiện, các ứng dụng liên quan đến Semantic Web cũng được mở rộng như: Phát triển các chuẩn công nghệ chung để biểu diễn thông tin và cho phép máy tính có thể hiểu được một số thông tin trên Web, hỗ trợ tìm kiếm  thông minh hơn, hỗ trợ việc khám phá, tách chiết thông tin, tích hợp dữ liệu và tự động hóa một số công việc thay cho con người.



Xét về mặt bản chất, Semantic Web chỉ là một công cụ để con người cũng như máy tính sử dụng để biểu diễn thông tin, hay nói chính xác hơn thì Semantic Web chỉ là một dạng dữ liệu trên Web. Khác với các dạng thức dữ liệu được trình bày trong HTML, dữ liệu trong Semantic Web được đánh dấu, phân lớp, mô hình hóa, được bổ sung thêm các thuộc tính, các mối liên hệ… theo các lĩnh vực cụ thể, qua đó giúp cho các phần mềm máy tính có thể hiểu được dữ liệu và tự động xử lý được những dữ liệu đó. Chẳng hạn, với cụm từ “Nguyễn Văn Nam”, trong không gian Semantic Web, nó có thể được suy luận đây là một tên người Việt, với các thuộc tính cụ thể như: năm sinh, địa chỉ, số điện thoại, email...

Một thí dụ từng gây nhầm lẫn cho nhiều người trên khắp thế giới là khi tìm kiếm từ "Paris", điều bạn mong muốn sẽ là gì? Là thủ đô nước Pháp hay tên của một người nổi tiếng Paris Hilton. Sức nặng của 2 từ khóa này là ngang nhau, do đó nếu không có suy luận ngữ nghĩa đặt trong ngữ cảnh, bối cảnh tìm kiếm thì bạn sẽ không thể nhận được thông tin mong muốn nếu chỉ đơn giản gõ từ khóa đó lên google search.



Sở dĩ Semantic Web hiện nay chưa được biết đến nhiều, chưa được phát triển lên một đỉnh cao là vì bản thân các lớp ngôn ngữ biểu diễn chúng còn chưa được hoàn thiện, các ứng dụng hỗ trợ Semantic Web còn rất ít và hiện đang được nghiên cứu, phát triển. Chúng ta có thể hình dung điều này thông qua ví dụ cụ thể là ngôn ngữ HTML, một ngôn ngữ được dùng để biểu diễn thông tin trên trang Web hiện tại. Các trang Web sử dụng HTML đều có thể được đọc và hiển thị trên các chương trình gọi là trình duyệt (chẳng hạn như Internet Explorer hay Firefox…), còn các trang Semantic Web thì hiện nay chưa có một chương trình nào cụ thể được gọi là trình duyệt để xử lý nó cả.



Bản thân Semantic Web chỉ là một dạng dữ liệu, vì vậy cần phải có các chương trình máy tính chuyên biệt để xử lý nó. Đó chính là các công cụ cho phép thu hổi, tách chiết, tìm kiếm, biểu diễn thông tin… trong không gian của Semantic Web. Hiện nay, cùng với việc đề xuất ra các chuẩn ngôn ngữ biểu diễn Semantic Web, các chương trình xử lý Semantic Web cũng đang được gấp rút nghiên cứu và phát triển.

Mô hình của Semantic Web được cấu thành từ nhiều tầng khác nhau. Hiện nay, đã có một số nhà nghiên cứu đưa ra những mô hình khác nhau về Semantic Web dựa trên những cách nhìn nhận khác nhau. Mô hình dưới đây  lấy từ trang web của tổ chức W3C:



Như các bạn thấy ở hình trên, Semantic Web được cấu thành từ nhiều tầng. Trên thực tế thì một số tầng đã được hoàn thiện, có những ứng dụng rộng rãi, nổi đình nổi đám và được nhiều người biết đến như Unicode, XML. Bắt đầu từ tầng logic trở lên, hiện nay các nhà khoa học vẫn đang còn bắt tay vào nghiên cứu.

(Theo Internet)