Luận văn Ứng dụng web ngữ nghĩa trong lưu trữ và quản lý các tài liệu số

ĐẠI HỌC QUỐC GIA HÀ NỘI  
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ  
    
Lương Đỗ Long  
NG DỤNG WEB NGỮ NGHĨA TRONG  
LƯU TRỮ QUẢN LÍ CÁC TÀI LIU SỐ  
LUẬN VĂN THẠC KHOA HỌC  
HÀ NI - 2011  
ĐẠI HỌC QUỐC GIA HÀ NỘI  
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ  
    
Lương Đỗ Long  
NG DỤNG WEB NGỮ NGHĨA TRONG  
LƯU TRỮ VÀ QUẢN LÍ CÁC TÀI LIU SỐ  
Ngành: Công nghệ thông tin  
Chuyên ngành: Hệ thống thông tin  
Mã s: 60.48.05  
LUẬN VĂN THẠC KHOA HỌC  
Cán bhướng dn khoa học:  
PGS. TS Đỗ Trung Tun  
HÀ NI - 2011  
LỜI CAM ĐOAN  
Tôi xin cam đoan luận văn: “NG DỤNG WEB NGỮ NGHĨA TRONG LƯU  
TRQUẢN LÍ CÁC TÀI LIU Slà kết quả nghiên cứu của riêng tôi,  
không sao chép của riêng ai. Các số liệu và bảng biểu là hoàn toàn chính xác và nội  
dung luận văn có tham khảo và sử dụng các tài liệu, thông tin đuợc đăng tải trên các  
tác phẩm, tạp chí và các trang web theo danh mục tài liệu của luận văn.  
nội, ngày 02 tháng 05 năm 2011  
Tác giả luận văn  
Lương Đỗ Long  
i
LI CẢM ƠN  
Trước tiên tôi xin chân thành cảm ơn PGS.TS Đỗ Trung Tun, người thầy đã  
hướng dẫn tận tình, chỉ bảo thẳng thắn và đã động viên tôi rất nhiều để tôi hoàn  
thành bản luận văn này.  
Tôi xin chân thành cảm ơn các thầy, cô giáo của Trường Đại học Công nghệ  
đặc biệt là các thầy, cô giáo trong bộ môn Hê thống Thông tin đã giảng dạy, động  
viên và tạo điều kiện thuận lợi cho tôi trong quá trình học tập và làm luận văn.  
Sau cùng, tôi xin đuợc gửi lời cám đến các bạn đng nghip, các bạn học viên  
cao học khóa 15 - những người đã động viên, giúp đỡ tôi trong sut quá trình học  
tp và thc hin luận văn này.  
Hà ni, Mùa năm 2011  
Tác giả luận văn  
Lương Đỗ Long  
ii  
MỤC LỤC  
Chương 1. TNG QUAN VWEB NGỮ NGHĨA .................................................1  
1.1. Khái nim Web ngữ nghĩa và Siêu dliu.....................................................1  
1.1.1. Khái nim................................................................................................1  
1.1.2. Siêu dliu .............................................................................................2  
1.2. Kiến trúc Web ngữ nghĩa...............................................................................3  
1.3 Ngôn ngữ Cơ cấu mô tả tài nguyên và Bn thlun........................................8  
1.3.1 Ngôn ngtả tài nguyên RDF ..............................................................8  
1.3.2 Bản thlun ...........................................................................................15  
1.3.3 Lược đồ RDF và truy vn RDF...............................................................16  
Kết luận..............................................................................................................23  
Chương 2. TIP CN WEB NGỮ NGHĨA TRONG LƯU TRỮ VÀ QUẢN LÍ TÀI  
LIU S................................................................................................................24  
2.1 Web ngữ nghĩa và thư viện s.......................................................................24  
2.1.1 Thư viện sngữ nghĩa............................................................................24  
2.1.2. Tchc tri thức trong thư viện ..............................................................26  
2.1.3. Web ngữ nghĩa trong thư viện s...........................................................26  
2.2. Kiến trúc của thư viện sngữ nghĩa.............................................................30  
2.3. Bản thluận cho thư viện sngữ nghĩa .......................................................31  
2.3.1. Bản thlun biểu ghi thư mục ...............................................................31  
2.3.2. Bản thlun cho cu trúc ni dung........................................................33  
2.3.3. Cơ bản vsphân loại ..........................................................................34  
2.3.4. Xây dng Bản thlun ..........................................................................36  
2.4. Thư viện sngữ nghĩa và mạng xã hi.........................................................37  
2.5. Tìm kiếm trong thư viện ngữ nghĩa..............................................................38  
iii  
2.5.1. Tìm kiếm da trên sphân loại .............................................................38  
2.5.2. Tìm kiếm ngữ nghĩa ..............................................................................38  
Kết luận..............................................................................................................40  
Chương 3. Xây dng thư vin sngữ nghĩa da trên phn mm JeromeDL...........41  
3.1 Gii thiu phn mm JeromeDL...................................................................41  
3.2. Kiến trúc và Bản thể luận trong JeromeDL ..................................................42  
3.2.1. Kiến trúc của JeromeDL........................................................................42  
3.2.2. Bản thể luận trong JeromeDL................................................................44  
3.3. Truy vấn trong JeromeDL............................................................................48  
3.4. Sử dụng JeromeDL......................................................................................51  
Kết luận..............................................................................................................53  
KT LUN VÀ HƯỚNG PHÁT TRIN..............................................................54  
TÀI LIU THAM KHẢO......................................................................................56  
iv  
Bảng kí hiu thut ngviết tt  
Tiếng Vit  
Tên viết tt  
WWW  
Tiếng Anh  
Mạng toàn cầu  
World Wide Web  
Tổ chức Mạng toàn cầu  
Cơ cấu mô tả tài nguyên  
World Wide Web Consortium  
W3C  
RDF  
Resource Description Framework  
Lược đồ Cơ cấu mô tả tài Resource Description Framework  
nguyên Scheme  
RDFS  
XML  
Ngôn ngữ đánh dấu mở rộng eXtensible Markup Language  
v
Danh mục hình nh  
Hình 1.1. Kiến trúc của Web ngữ nghĩa..........................................................................................4  
Hình 1.2. Đồ thị RDF...................................................................................................................11  
Hình 1.3. Quan hệ kế thừa............................................................................................................17  
Hình 1.4. Không gian miền và giới hạn của thuộc tính RDFS.......................................................20  
Hình 2.1. Các thành phần hỗ trợ thư viện số ngữ nghĩa.................................................................26  
Hình 2.2. Biu din cu trúc tài liu dưới dạng RDF.....................................................................29  
Hình 2.3. Kiến trúc thư vin sngữ nghĩa ....................................................................................31  
Hình 2.4. Bản thlun BibTeX ....................................................................................................32  
Hình 2.5. Một dạng cây phân cấp .................................................................................................35  
Hình 2.6. Một Bản thể luận Cys ...................................................................................................35  
Hình 2.7. Quá trình tìm kiếm trong thư vin sngữ nghĩa ............................................................39  
Hình 2.8. Quá trình chia sẻ dliu RDF.......................................................................................40  
Hình 3.1. Giao diện của JeromeDL ..............................................................................................42  
Hình 3.2. Kiến trúc của JeromeDL ...............................................................................................43  
Hình 3.3. Bản thể luận MarcOnt...................................................................................................44  
Hình 3.4. Bản thể luận cấu trúc nội dung......................................................................................46  
Hình 3.5. Mạng xã hội trong JeromeDL .......................................................................................48  
Hình 3.6. Các bước trong truy vấn JeromeDL...............................................................................49  
Hình 3.7. Giao diện chức năng tìm kiếm ngữ nghĩa ......................................................................52  
Hình 3.8. Giao diện chức năng xuất bản tài liệu............................................................................53  
vi  
Danh mục bảng biu  
Bảng 1. Các lớp trong RDFS........................................................................................................18  
Bảng 2. Các thuộc tính trong RDFS .............................................................................................19  
Bảng 3. Các lớp, thuộc tính, thể hiện của Bản thể luận MarcOnt...................................................45  
Bảng 4. Các lớp, thuộc tính, thể hiện của Bản thể luận cấu trúc nội dung......................................47  
vii  
MỞ ĐẦU  
Web ngữ nghĩa (hay Semantic Web) là thế hệ mở rộng của Web hiện tại được  
đưa ra bởi Tim Berners-Lee vào khoảng năm 1998. Mục tiêu ban đầu của Semantic  
Web là để hỗ trợ người dùng tìm kiếm thông tin trên mạng một cách nhanh chóng,  
chuẩn xác và thông minh hơn so với các công cụ tìm kiếm truyền thống.  
Theo định nghĩa của tchc World Wide Web Consortium (W3C), web ngữ  
nghĩa là smrng của WWW hin tại bng cách thêm vào các mô tả ý nghĩa (hay  
ngữ nghĩa) của thông tin dưới dạng mà chương trình mà máy tính có thhiểu được  
và do vy cho phép xử lí thông tin có hiu quả hơn. Web ngữ nghĩa cgng làm sao  
để máy tính hiểu được các khái nim, mi quan hgia các khái nim, các thuc  
tính và các tiến trình của chúng. Trong trường hp này, máy tính có khả năng ra kết  
lun và trích xut ra thông tin mi và có giá trị từ các dliệu đã tn tại. Web ngữ  
nghĩa không phải là Trí tunhân tạo (AI), nhưng nó có thxem là mt loại web  
thông minh, hay thế hệ phát trin tiếp theo của web. Nn tảng cơ bản làm nên web  
ngữ nghĩa là các siêu dliu (metadata) và bản thlun. Siêu dliu có thhiu  
đơn giản là dliu vdliu, còn bản thluận định nghĩa về các tvựng được sử  
dụng trong các min ng dụng khác nhau. Các siêu dliu có thdùng để biu din  
cho mọi loại tài nguyên (thc thhoc các khái nim). Mt cách để biu din các  
khái nim, và mi quan hgia chúng trong mt tài liu là sử dụng ngôn ngtả  
tài nguyên RDF (Resource Description Framework).  
Các tài liu s(tài nguyên) thường đường lưu trữ và truy cp qua các cng  
thông tin và các thư viện s. Các thư viện số ngoài chức năng lưu trữ các tài liu s,  
còn có chức năng cho phép người sử dụng tìm kiếm các tài liu có liên quan mt  
cách nhanh nht. Các siêu dliu là mt trong nhng cách tiếp cn cho vic biên  
mục, phân loại và htrợ tìm kiếm các tài liu s. Trong cách biu din bi các siêu  
dliu, các tài liu số đưc “cu trúc hóa” vào các siêu dliu. Bt kì thông tin nào  
trong c thư viện số cũng có thể được biu din bi các siêu dliu, vi cách biu  
din này sẽ thun li cho vic quản lí và người dùng dễ dàng tìm kiếm ra các tài liu  
gc. Ngoài ra, cách tiếp cn này cho phép các thư viện sdễ dàng chia sẻ các tài  
nguyên vi nhau da trên mt chuẩn đặc tả chung. Vic tích hp ngữ nghĩa vào các  
viii  
thư viện sda trên kiến trúc của Web ngữ nghĩa làm cho thư viện số có nhiều ưu  
điểm hơn so với cách tiếp cn thông thường.  
Luận văn này tìm hiu chung nht vkiến trúc của web ngữ nghĩa, da trên  
cách tiếp cn web ngữ nghĩa, tìm hiu cách tích hp ngữ nghĩa vào các thư viên số.  
Cu trúc của luận văn gồm 3 chương:  
Chương 1: Tng quan vWeb ngữ nghĩa  
Tìm hiu chung nht vkiến trúc của web ngữ nghĩa, các thành phần cơ bản  
làm nên web ngữ nghĩa.  
Chương 2: Tiếp cn Web ngtrong lưu trữ và quản lí tài liu số  
Tìm hiu mt trong nhng cách quản lí tài liu số đó là thư viện s. Nghiên  
cu cách tích hp ngữ nghĩa vào các tài nguyên trong thư viện s: cơ chế biên mục  
và phân loại da trên ngữ nghĩa  
Chương 3: Xây dng thư viện sngữ nghĩa da trên phn mm  
JeromeDL  
Gii thiu phn mm mã ngun mJeromeDL trong vic xây dng các thư  
vin sngữ nghĩa.  
ix  
Chương 1. TNG QUAN VWEB NGỮ NGHĨA  
Trong chương này, sẽ gii thiu công nghệ cơ bản được sử dụng trong lun  
văn, bao gồm định nghĩa vweb ngữ nghĩa, nhng nlc trong vic xây dng web  
ngữ nghĩa tweb hin tại, gii thiu kiến trúc web ngữ nghĩa của tchc World  
WideWeb Consortium (W3C). Tìm hiu về Bản thlun và ngôn ngữ bn thlun.  
1.1. Khái nim Web ngữ nghĩa và Siêu dliu  
1.1.1. Khái nim  
Sau khi ra đời của Internet và World Wide Web (WWW), rt nhiu nhng nỗ  
lực đã được thc hin và các công nghệ được phát trin nhm mục đích làm cho  
World Wide Web tốt hơn, nhanh hơn, và thông minh hơn. Nhiu công ngh, kiến  
nghị sau khi xut hiện đã trở thành chun chung chỉ trong mt thi gian ngn. Mt  
trong nhng nlc này là web ngữ nghĩa. Web ngữ nghĩa có thể được xem là smở  
rng của web hin tại. Web ngữ nghĩa không phải là Trí tunhân tạo, nhưng có thể  
xem là mt dạng web thông minh.  
Web ngữ nghĩa là sự mở rộng của WWW bằng cách thêm vào các mô tả ngữ  
nghĩa của thông tin dưới dạng mà chương trình máy tính có thể “hiểu” và do vậy  
cho phép xử lý thông tin hiệu quả hơn [3]. Xét về mặt bản chất, Semantic Web ngữ  
nghĩa chỉ là một công cụ để con người cũng như máy tính sử dụng để biểu diễn  
thông tin, hay nói chính xác hơn thì Web ngữ nghĩa chỉ là một dạng dữ liệu trên  
Web. Khác với các dạng thức dữ liệu được trình bày trong HTML, dữ liệu trong  
Semantic Web được đánh dấu, phân lớp, mô hình hóa, được bsung thêm các thuộc  
tính, các mối liên hệ… theo các lĩnh vực cụ thể, qua đó giúp cho các phần mềm  
máy tính có thể hiểu được dữ liệu và tự động xử lý được những dữ liệu đó.  
Có thkể ra đây những ưu điểm của web ngữ nghĩa so vi web hin tại:  
Máy tính có thể hiểu được thông tin trên Web: Web ngữ nghĩa định nghĩa  
các khái niệm và bổ sung quan hệ dưới dạng máy tính có thể hiểu được. Do  
1
đó, việc tìm kiếm, đánh giá, xử lý, tích hợp thông tin có thể được tiến hành  
một cách tự động.  
Thông tin được tìm kiếm nhanh chóng và chính xác hơn: Với Web ngữ  
nghĩa, máy tính có thể xác định một thực thể thuộc lớp hay thuộc tính cụ thể  
nào dựa trên ngữ cảnh chứa nó. Do đó thu hẹp không gian tìm kiếm và cho  
kết quả nhanh, chính xác hơn.  
Khả năng suy luận thông minh: Dựa vào các luật suy diễn trên cơ sở tri thức  
về các thực thể, máy tính có khả năng sinh ra những kết luận mới.  
Dữ liệu liên kết động: Thay thế cách liên kết sử dụng hyperlink tĩnh trong  
Web cũ, Web ngữ nghĩa liên kết dữ liệu từ nhiều nguồn khác nhau một cách  
hiệu quả hơn dựa trên định danh của tài nguyên (URI) và quan hệ giữa  
chúng. Cách liên kết này đôi khi còn được gọi là liên kết bằng siêu dữ liệu.  
Trong web ngữ nghĩa, vi strợ giúp của các công nghệ khác, chúng ta có thể  
trợ giúp cho máy tính hiểu được các khái nim, mi quan hgia chúng, xử lí  
nhanh chóng, chính xác các truy vn tngười dùng.  
1.1.2. Siêu dliu  
Mt trong nhng nn tảng cơ bản làm nên web ngữ nghĩa là các siêu dliu.  
Siêu dữ liệu dùng để mô tả tài nguyên thông tin, còn gọi là dliu vdliu. Mi  
thc thhay khái nim có thể có mt hay nhiu siêu dliu. Cho ví dụ, mt khóa  
lun tt nghin có [mt tác giả], [tên khóa lun], [cán bhướng dn], ... là các siêu  
dliu về khóa lun. Chúng ta có thể đơn giản hóa việc phân loại và truy vấn dữ  
liệu bằng cách dùng các siêu dữ liệu.  
Mối liên hệ giữa siêu dữ liệu và tài nguyên thông tin mà nó mô tả có thể được  
thể hiện ở một trong hai cách sau:  
Các phần tử metadata được chứa trong một biểu ghi tách biệt bên ngoài  
đối tượng mô tả.  
Các phần tử metadata có thể được nhúng (gắn) vào bên trong tài  
nguyên mà nó mô tả.  
Trước đây với tài liệu truyền thống, các mô tả dữ liệu nằm ngoài đối tượng mô  
tả, như vậy siêu dữ liệu được lưu trữ một cách tách biệt bên ngoài đối tương mô tả.  
2
Với tài liệu số, siêu dữ liệu của chúng được nhúng (gắn) trong bản thân tài  
nguyên hoặc liên kết với tài nguyên mà nó mô tả như trong trường hợp các thẻ meta  
của tài liệu HTML  
i. Sơ đsiêu dliu  
Sơ đồ siêu dữ liệu là tập hợp những yếu tố siêu dữ liệu được thiết kế cho mô tả  
một dạng tài nguyên thông tin cụ thể. Như vậy siêu dữ liệu là sơ đồ hình thức được  
xác định để mô tả tài nguyên thông tin cho đối tượng số hoặc không số. Thí dụ tập  
hợp yếu tố siêu dữ liệu Dublin Core có sơ đồ bao gồm 15 yếu tố cơ bản để mô tả tài  
nguyên thông tin.  
ii. Ngữ nghĩa  
Định nghĩa các yếu tố hoặc ý nghĩa đực gán cho các yếu tố siêu dữ liệu thì  
được gọi là ngữ nghĩa của sơ đồ. Mỗi sơ đồ siêu dữ liệu có ngữ nghĩa và cú pháp  
được quy định riêng. Ví dtrong yếu tố siêu dữ liệu Dublin Core yếu tố “Creator” –  
dùng để xác định là tác giả của tài liệu, hoặc yếu tố “Title” được hiểu là nhan đề  
của tài liệu.  
iii. Ni dung  
Giá trị (dữ liệu) của từng yếu tố được gọi là nội dung. Đó chính là giá trị của  
mỗi yếu tố siêu dữ liệu. Nhờ các sơ đồ dữ liệu, các chương trình xử lý tự động sẽ  
nhận biết đoạn dữ liệu nào sẽ thuộc thành phần nào, chẳng hạn đoạn dữ liệu này  
được nhận biết là nhan đề, đoạn dữ liệu kia được nhận biết là tác giả của tài liệu.  
1.2. Kiến trúc Web ngữ nghĩa  
Để được nhng khả năng như đã đề cp phn trên, web ngữ nghĩa cn có  
mt hạ tng cht chẽ vi nhiu lp htr. Dưới đây là kiến trúc tng quát nht của  
web ngữ nghĩa do tchc W3C đề xut:  
3
Hình 1.1. Kiến trúc của Web ngữ nghĩa  
i. Unicode định danh tài nguyên thng nht  
Tng thp nht là tài nguyên (một đối tượng, mt thc thhay mt khái nim,  
v.v...), chúng được mô tả bng các định danh tài nguyên thng nht - Uniform  
Resource Identifier (URI). Mục đích của tng này là xác định tính duy nht của mi  
tài nguyên. Mt tài nguyên có duy nht mt URI, tp con của URI là định vị tài  
nguyên thng nht: Uniform Resource Locator (URL), nó chứa phương thức truy  
cp và vị trí của tài liu trên mạng. Mt tp con khác của URI là tên tài nguyên  
thng nht : Uniform Resource Name (URN), cho phép xác định mt tài nguyên mà  
không cn phải chứa địa chỉ và phương thức truy cp đến nó, ví dụ chỉ sISBN là  
mt URN. Vic sử dụng URI là rt quan trọng, vì nó cho phép xây dng mt hệ  
thng phân tán, trong đó các tài nguyên nm nhiều nơi khác nhau trên mạng. Mt  
biến thể khác của URI là định danh tài nguyên được quc tế hóa: Internationalized  
Resource Identifier (IRI), nó cho phép sử đụng các kí tự Unicode trong định danh  
[1].  
Để mã hóa các thông tin, dliu ta sử dụng chun mã hóa Unicode, đây là  
chun thng nht dùng để mã a các tp kí tquc tế. Nó cho phép tt cả các ngôn  
ngữ của tt cả các nước có thể được mã hóa thng nht, tránh hin tượng mi quc  
gia lại sử dng mt chun mã hóa riêng, gây khó khăn cho trao đổi dliu.  
4
ii. Biu din XML  
Tng tiếp theo là Ngôn ngữ đánh du mrng: Extensible Markup Language  
(XML), nó được dùng để biu din dliu mà máy tính có thhiu và xử lí dliu  
được. XML là công nghệ chính và là chun của web hin tại và trong tương lai. Vi  
XML, máy tính có thể tích hp và tương c trao đổi dliu vi nhau. XML cung  
cấp một phương tiện dùng văn bản để mô tả thông tin và áp dụng một cấu trúc kiểu  
cây cho thông tin đó. Tại mức căn bản, mọi thông tin đều thể hiện dưới dạng text,  
chen giữa là các thẻ đánh dấu với nhiệm vụ ký hiệu sự phân chia thông tin thành  
một cấu trúc có thứ bậc của các dữ liệu ký tự, các phần tử dùng để chứa dữ liệu, và  
các thuộc tính của các phần tử đó. Đơn vị cơ sở của XML là các ký tự theo định  
nghĩa của Bộ ký tự toàn cầu (Universal Character Set). Các ký tự được kết hợp theo  
các tổ hợp chuỗi hợp lệ để tạo thành một tài liệu XML. Tài liệu này gồm một hoặc  
nhiều thực thể, mỗi thực thể thường là một phần nào đó của các ký tự thuộc tài liệu,  
được mã hóa dưới dạng một chuỗi các bit và lưu trữ trong một tệp văn bản.  
Các tệp XML có thể dùng cho nhiều loại dữ liệu đa phương tiện. RFC3023  
định nghĩa các loại "application/xml" và "text/xml", với ý rằng dữ liệu được biểu  
diễn bằng XML mà không nói gì đến ngữ nghĩa của dữ liệu.  
Bằng cách cho phép các tên dữ liệu, cấu trúc thứ bậc được phép, và ý nghĩa  
của các phần tử và thuộc tính có tính chất mở và có thể được định nghĩa bởi một  
lược đồ tùy biến được (XML Scheme), XML cung cấp một cơ sở cú pháp  
(Document Type Definition - DTD) cho việc tạo lập các ngôn ngữ đánh dấu dựa  
XML theo yêu cầu. Cú pháp chung của các ngôn ngữ đó là cố định — các tài liệu  
phải tuân theo các quy tắc chung của XML, bảo đảm rằng tất cả các phần mềm hiểu  
XML ít ra cũng phải có khả năng đọc (phân tích cú pháp) và hiểu bố cục tương đối  
của thông tin trong các tài liệu đó. Lược đồ chỉ bổ sung một tập các ràng buộc cho  
các quy tắc cú pháp. Các lược đồ thường hạn chế tên của phần tử và thuộc tính và  
các cấu trúc thứ bậc được phép, ví dụ, chỉ cho phép một phần tử tên 'ngày sinh' chứa  
một phần tử tên 'ngày' và một phần tử có tên 'tháng', mỗi phần tử phải chứa đúng  
một ký tự.  
Có một khái niệm rất quan trọng trong XML là Không gian tên XML (XML  
namespace). Không gian tên XML cơ chế cho phép gom các tên phân tử và thuc  
tính vào mt nhóm. Nó thường xuyên đưc dùng để phi hp vic dùng tên phn tử  
(hay thuc tính) tnhiu ngun khác nhau trong mt tài liu XML, mà vn tránh  
được nguy cơ trùng tên. Mt Không gian tên là tp hp các tên có thể dùng trong tài  
5
liu XML, như tên các phn t, thuc tính,..., nó gom các tên này vào các vùng  
riêng.  
iii. Trao đổi dliu RDF  
Cơ cu mô tả tài nguyên - RDF được W3C giới thiệu để cung cấp một cú pháp  
chuẩn để tạo, thay đổi và sử dụng các chú thích trong Web ngữ nghĩa. Một mệnh đề  
RDF là một bộ ba có dạng: [chủ đề], [thuộc tính], [đốitượng]. Trong đó, [chủ đề] là  
tài nguyên mà được mô tả bằng [thuộc tính] và [đối tượng]. [Thuộc tính] thể hiện  
mối quan hệ giữa [chủ đề] và [đối tượng]. Còn [đối tượng] ở đây có thể là một tài  
nguyên hoặc một giá trị. Ba thành phần trên trong RDF đều là các URI.  
Ví dụ vbiu din RDF của siêu dliu Dublin Core:  
<rdf:RDF  
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
xmlns:dc="http://purl.org/dc/elements/1.1/">  
<rdf:Description rdf:about=  
"http://ebook.com/onthidaihoc/toan/KhaoSatHamSo.pdf">  
<dc:creator>Lương Đỗ Long</dc:creator>  
<dc:title>Các dạng khảo sát hàm s</dc:title>  
<dc:description>Giới thiệu các dạng khảo sát hàm sthường hay gặp  
trong các kì thi đại học</dc:description>  
<dc:date>2000-01-20</dc:date>  
</rdf:Description>  
</rdf:RDF>  
Chi tiết vRDF sẽ đưc đề cp chi tiết phn sau.  
iv. Lược đồ RDF  
Để xác định ra cu trúc và ngữ nghĩa của RDF, ngôn nglược đồ RDF: RDF  
Scheme (hay RDFS) đã được đề xut. RDFS là một ngôn ngữ Bản thlun đơn  
giản của web ngữ nghĩa, được coi là một ngôn ngữ cơ sở của web ngữ nghĩa. RDFS  
cung cp một phương tiện để đặc tả các tvng mô tả tính cht và quan hgia các  
tài nguyên RDF, bao gm:  
-
-
-
Định nghĩa các lớp tài nguyên  
Định nghĩa các quan hệ giữa các lớp  
Định nghĩa các loại thuộc tính mà các lớp trên có  
6
-
Định nghĩa các mối quan hệ giữa các thuộc tính.  
v. Bản thlun  
Đối vi mi min ng dụng cụ th, sẽ có mt tp các khái nim và các mi  
quan h, ràng buc gia chúng tạo thành mt bản thlun. Mt khái nim có thể là  
mt lp, mt thuc tính của mt lp hay btvng sử dụng trong min ng dụng  
đó. Bộ từ vựng bản thluận được xây dựng trên cơ sở tầng RDF và RDFS, cung  
cấp biểu diễn ngữ nghĩa mềm dẻo cho tài nguyên web và có khả năng hỗ trợ lập  
luận. Để xây dựng được các bộ từ vựng này, người ta đã sử dụng các ngôn ngữ bản  
thluận để biểu diễn chúng như: RDFS, OIL, DAML, DAML+OIL, hay ngôn ngữ  
bản thlun cho web (OWL), ... Các ngôn ngữ này cung cấp khả năng biểu diễn và  
hỗ trợ lập luận khác nhau và chúng dựa trên nền tảng là các ngôn ngữ logic mô tả  
tương ứng khác nhau.  
Để cung cp các lut suy din da trên các ngôn ngữ bản thlun, mt số  
ngôn ngluật đang được phát trin và chun hóa, chng hạn, ngôn ngQui tc trao  
đổi đnh dạng (Rule Interchange Format RIF ).  
Để truy vn dliu RDF trong một cơ sở tri thc, ngôn ngtruy vn RDF:  
Simple Protocol and RDF Query Language – SPARQL đã được đề xut. Ngôn ngữ  
SPARQL là ngôn ngtruy vấn tương tự như ngôn ngữ truy vn có cu trúc SQL  
dùng để thao tác vi các hhệ quản trị CSDL quan hệ  
vi. Tng Logic  
Việc biểu diễn các tài nguyên dưới dạng các bộ từ vựng ontology có mục đích  
là để máy có thể lập luận được. Mà cơ sở lập luận chủ yếu dựa vào logic. Chính vì  
vậy mà các ontology được ánh xạ sang logic, cụ thể là logic mô tả để có thể hỗ trợ  
lập luận. Vì logic mô tả có biểu diễn ngữ nghĩa hình thức và cung cấp các dịch vụ  
lập luận, là cơ sở để hỗ trợ máy tính có thể lập luận và hiểu tài nguyên.  
vii. Tng chng minh  
Tầng này đưa ra các luật để suy luận. Cụ thể từ các thông tin đã có ta có thể  
suy ra các thông tin mới. Ví dụ: A là cha của B, A là em trai C thì khi đó ta có thông  
tin mới là C là bác của B. Để có được các suy luận này thì cơ sở là FOL (First-  
Order-Logic). Và tầng này hiện nay các nhà nghiên cứu đang xây dựng các ngôn  
ngữ luật cho nó như: SWRL, RuleML.  
7
Để đảm bảo dliệu đầu vào đáng tin cy, có thsử dụng mt mã, chng hạn  
như sử dụng chữ kí điện tử để thẩm định xut xứ ca ngun dliu [2]  
viii. Tng xác nhn  
Đảm bảo tính tin cậy của các ứng dụng trên Web ngữ nghĩa. Ví d: có một  
mnh đề: X là A, một mệnh đề khác lại xác định X không là A, như thế Web ngữ  
nghĩa là không đáng tin cậy? Câu trả lời ở đây được xem xét trong các ngữ cảnh.  
Mi ứng dụng trên web ngữ nghĩa sẽ có một ngữ cảnh cụ thể, chính vì thế các mệnh  
đề trên có thể nằm trong các ngữ cảnh khác nhau khi đó ngữ nghĩa tương ứng khác  
nhau nên các mệnh đề đó vẫn đúng, đáng tin cậy trong ngữ cảnh của nó. Để có được  
sự chứng minh về độ tin cậy thì các lập luận được áp dụng là không đơn điệu và có  
các cơ chế kiểm tra chứng minh kết hợp với công nghệ chữ ký điện tử để xác nhận  
độ tin cậy. Các ngôn ngữ chứng minh là ngôn ngữ cho ta chứng minh một mệnh đề  
là đúng hay sai.  
ix. Giao din người dùng và ứng dụng  
Đây là tng trc tiếp giao tiếp vi người dùng và ứng dụng, tng này cung cp  
giao din cho người dùng và các dịch vụ khác truy cp.  
1.3 Ngôn ngữ Cơ cu mô tả tài nguyên và Bản thlun  
1.3.1 Ngôn ngtả tài nguyên RDF  
Ngôn ngữ biểu diễn dữ liệu và tri thức là một khía cạnh quan trọng của  
Semantic Web. Như đã đề cp bên trên, XML là nn tảng cơ bản làm nên web  
ngữ nghĩa, tuy nhiên XML không đủ khả năng để tạo ra ngữ nghĩa trong web. Mc  
dù XML cho phép người dùng thêm dliu tùy ý vào cu trúc tài liệu nhưng nó  
không đề cp gì đến ngữ nghĩa của tài liu hàm cha.  
Ngôn ngữ Cơ cấu mô tả tài nguyên - RDF được đề xut nhm khc phục  
nhng nhược điểm của XML không thể giải quyết được. Định nghĩa cơ bản của  
ngôn ngRDF là dùng để mã hóa các siêu dliu của các tài nguyên vào mt bba  
(RDF Triple): [chủ ng], [vị ng] và [đối tượng]. Ta biết rng mi mt thc thhay  
khái nim đều có các thuc tính, mi thuc tính đều có các giá trị, vì vy mọi tài  
nguyên ng đều có thể đưc biu din qua ngôn ngRDF.  
XML cung cấp cú pháp để mã hóa dữ liệu, RDF là một cơ cấu chỉ ra điều gì  
đó về dữ liệu. RDF cung cấp một mô hình dữ liệu, và một cú pháp đơn giản sao cho  
8
các hệ thống độc lập có thể trao đổi và sử dụng nó. RDF được thiết kế sao cho hệ  
thống máy tính có thể hiểu được và có thể đọc được thông tin, chứ không phải để  
trình bày dữ liệu cho người dùng. Là một thành phần của Web ngữ nghĩa, được đặt  
trên XML, RDF sử dụng cú pháp của XML để biểu diễn thông tin, điều này có  
nghĩa là các tài liệu RDF được viết bằng XML. Ngôn ngữ XML dùng để biểu diễn  
thông tin trong RDF được gọi là RDF/XML. Thông qua định dạng này, các thông  
tin trong RDF có thể được trao đổi dễ dàng giữa các hệ thống máy tính cũng như  
các hệ điều hành hay các ngôn ngữ lập trình ứng dụng khác nhau.  
RDF mô tả các nguồn tài nguyên bi bba [chủ ng], [vị ng], [ đối tượng].  
Một [vị ng] là một khía cạnh, tính chất, thuộc tính, hay mối liên hệ mô tả cho một  
tài nguyên. Một phát biu bao gồm một tài nguyên riêng biệt, một thuộc tính được  
đặt tên, và giá trị thuộc tính cho tài nguyên đó ([đối tượng]). Giá trị này cơ bản có  
thể là một tài nguyên khác hay một giá trị mang tính nghĩa đen hay dạng chuỗi văn  
bản tùy ý. [Chủ ng] và đối tượng được xác định qua Định danh tài nguyên thng  
nht – URI, chng hạn chúng có thể là mt liên kết của mt trang web. Các [vị ng]  
cũng được xác định qua URI, do đó bt kì ai ng có thể định nghĩa ra mt khái  
nim mi, mt thuc tính mi, bng cách chỉ cần định nghĩa URI cho chúng. Bi vì  
RDF sử dụng URI để biu din các thông tin trong mt tài liu, các URI đảm bảo  
rng các khái nim không chỉ chứa văn bản thun túy mà nó còn là định danh tài  
nguyên duy nht mà tt cả người dùng có thể tìm kiếm được trên mạng. Trong  
RDF, các URI đóng một vai trò rất quan trọng: Chúng ta có thể tạo ra các (siêu) dữ  
liệu dựa trên bất kỳ một nguồn tài nguyên nào trên Web, ngữ nghĩa được đưa vào  
các nguồn tài nguyên Web thông qua các URI, và URI cho phép liên kết giữa các  
phần tử dữ liệu thông qua các thuộc tính.  
i. Mô hình dliu RDF  
Sự kết hợp của một nguồn tài nguyên ([chủ ng]), một thuộc tính ([vị ng]) và  
một giá trị của thuộc tính được ([đối tượng]) được đặt trong mt Phát_biu.  
Ví dụ mt câu nói như sau: “Giám đốc của công ty Garden Network là  
Nguyễn Văn A”. Như vậy, ta có thể biểu diễn bởi một Phát_biu với các “thông số”  
sau:  
- Chủ ngữ của Phát_biu RDF là: “Công ty Garden Network”  
- Tính chất là: “Giám đốc”  
- Đối tượng là: “Nguyễn Văn A”  
9
Mô hình cơ bản của RDF gồm ba bộ phận sau:  
Tài nguyên: là tất cả những gì được mô tả bằng biểu thức RDF  
Thuộc tính: là đặc tính hay quan hệ mô tả tính chất tài nguyên  
Phát_biểu: mỗi phát biểu gồm ba thành phần sau  
- [Chủ ng]: địa chỉ hay vị trí tài nguyên muốn mô tả.  
- [Vị ng]: xác định tính chất của tài nguyên.  
- [ Đối tượng]: nội dung gán cho thuộc tính.  
ii. RDF Cơ sở dliu quan hệ  
Trong c Cơ sở dliu quan htruyn thng, dliệu được lưu dưới dạng các  
bảng. Trong mi bảng, mi hàng là mt bản ghi không có gii hn vslượng các  
trường.  
Ví dụ ta có bng sau:  
ISBN  
10001111 Lp trình C Lê A  
10111112 Vi xử lí Trn H  
Tên  
Tác giả  
NXB  
ĐHQG  
Giáo dục  
Strang  
250  
300  
Giá bán  
45.000  
50.000  
Nếu lưu các dliu trên dưới dạng RDF, đòi hỏi các dliu phải được chia  
nhỏ để lưu dưới dạng các bba:  
ISBN  
Tên  
10001111 Lp trình C  
10111112 Vi xử lí  
Phát_biu: {10001111, Tên, “Lp trình C”}  
So vi CSDL quan h, cách lưu trữ dưới dạng RDF có những ưu điểm sau:  
- Tchc dliệu đơn giản, đồng nht nên thông tin dễ dàng chỉnh sa  
- Cu trúc bba giúp ta dtruy xut các thông tin bi các hthng suy  
lun, tìm kiếm ngữ nghĩa. ng nhvy mà nhng bxử lí RDF có thể  
suy ra nhng tri thc mi  
- Chia sẻ dliu trên mạng nhsự đng nht.  
10  
iii. Đồ thị RDF  
Tp hp các bba tạo thành đồ thị RDF (đồ thị có hướng). Các nút trong đồ  
thị là [chủ ng] và [đối tượng], các cung trong đồ thị là [Vị ng] và luôn có hường  
t[chủ ng] ti [đối tượng]. Dùng đồ thị làm cho thông tin thhin rõ ràng và dễ  
nh dung hơn.  
Hình 1.2. Đồ thị RDF  
iv. Cú pháp của RDF  
Mô hình RDF thể hiện một mô hình ở mức trừu tượng để định nghĩa siêu dữ  
liu. Cú pháp RDF được dùng để tạo ra và trao đổi siêu dliu, vì thế RDF da trên  
cú pháp XML.  
Cú pháp cơ bản của RDF có dạng như sau:  
[1] RDF ::= ['<rdf:RDF>'] description* ['</rdf:RDF>']  
[2] description ::= '<rdf:Description' idAboutAttr? '>' propertyElt*  
'</rdf:Description>'  
[3] idAboutAttr ::= idAttr | aboutAttr  
[4] aboutAttr ::= 'about="' URI-reference '"'  
[5] idAttr ::= 'ID="' IDsymbol '"'  
[6] propertyElt ::= '<' propName '>' value '</' propName '>'| '<' propName  
resourceAttr '/>'  
[7] propName ::= Qname  
[8] value ::= description | string  
[9] resourceAttr ::= 'resource="'tham chiếu URI'"'  
[10] Qname ::= [ NSprefix ':' ] name  
[11] URI-reference ::= string, interpreted per [URI]  
[12] IDsymbol ::= (bt kỳ ID nào hp lnào ca XML)  
[13] name ::= (bt kỳ tên hp lnào ca XML)  
[14] NSprefix ::= (bt kỳ tiếp đu ngnamespace hp lnào)  
[15] string ::= (bt kỳ chuỗi nào  
Ví d:  
Xét phát biu sau {ketquasoxo.html, create-date, “10-10-2010”}  
Cú pháp RDF/XML để biểu diễn cho phát biểu trên như sau:  
11  
1: <?xml version="1.0"?>  
2: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
3: xmlns:exterms="http://www.abc.vn/">  
4: <rdf:Description rdf:about="http://www.abc.vn/ketquasoxo.html">  
5: <exterms:creation-date>10-10-2010</exterms:creation-date>  
6: </rdf:Description>  
7: </rdf:RDF>  
Trong đó:  
Dòng 1: là khai báo XML, cho biết nội dung theo sau dựa trên cú pháp XML  
và phiên bản XML được dùng.  
Dòng 2 và 3: bắt đầu với thẻ rdf:RDF , cho biết rằng nội dung XML tiếp theo  
mô tRDF. Từ khóa này xác định tài liệu này được biểu diễn dưới dạng RDF. Tiếp  
theo là phn khai báo không gian tên XML được sử dụng trong tài liệu, tùy vào nhu  
cầu và mục đích sử dụng mà ta có thể dùng các không gian tên khác nhau cho từng  
tài liu.  
Dòng 4, 5, 6: mô tả những mệnh đề RDF. Để mô tả bất kỳ phát biểu nào dng  
RDF/XML có thể dùng rdf:Description, và rdf:about , đây chính là [chủ ng] của  
phát biểu. Thẻ bắt đầu rdf:Description trong dòng 4 cho biết bắt đầu mô tả về một  
tài nguyên, và tiếp tục định danh tài nguyên này dùng thuộc tính rdf:about để chỉ ra  
URI ca tài nguyên..  
Dòng 5 cung cấp 1 phần tử thuộc tính, với Qname là exterms:creation-date  
như là thẻ của nó. Nội dung của phần tử thuộc tính này là [đối tượng] ca  
Phát_biu, có giá trị là kiểu chui kí t“10 tháng 10 năm 2010 “.  
Dòng 7: cho biết kết thúc của thẻ rdf:RDF bắt đầu ở dòng 2 và cũng là thẻ  
kết thúc của tài liệu RDF.  
. Bcha RDF  
Để mô tả tập hợp của nhiều đối tượng như một bài báo khoa học được viết bởi  
nhiều tác giả, danh sách các sinh viên trong mt khóa học, v.v... RDF cung cấp  
nhiều kiểu và nhiều thuộc tính tích hợp sẵn giúp mô tả được những tập như vậy,  
trong đó có kiểu khai báo “bộ chứa” (container), dùng để lưu danh sách các tài  
nguyên hoặc các kiểu giá trị (Một bộ chứa là một nguồn tài nguyên chứa những cái  
đó, những cái gì đó được đặt trong bộ chứa được gọi là các thành viên).Các phần  
tử của mt bcha có thể là các tài nguyên URI (có thể là rng) hay là các giá trị  
12  
kiu chui kí t. RDF định nghĩa 3 loại đối tượng “bộ cha”: Bag, Sequence, và  
Alternative.  
<rdf:Bag> là danh sách không có thứ tự của các tài nguyên hoặc các giá trị.  
Bag cho phép những giá trị có thể trùng lặp nhau.  
Vi dụ  
<?xml version="1.0"?>  
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
xmlns:group="http://www.abc.vn/group#">  
<rdf:Description rdf:about="http://www.caohoc.com.vn/database">  
<group:member>  
<rdf:Bag>  
<rdf:li>Nguyễn Văn A</rdf:li>  
<rdf:li>Lê ThịC</rdf:li>  
<rdf:li>Trn B</rdf:li>  
</rdf:Bag>  
</group:member>  
</rdf:Description>  
</rdf:RDF>  
<rdf:Seq> là danh sách có thứ tự của các tài nguyên hoặc các giá trị. Chẳng  
hạn dùng Sequence để lưu trữ các giá trị theo thứ tự bảng chữ cái. Sequence cho  
phép những giá trị có thể trùng lặp nhau.  
Ví d:  
<?xml version="1.0"?>  
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
xmlns:class="http://www.abc.vn/class#">  
<rdf:Description rdf:about="http://www.caohoc.com.vn/K15T2">  
<class:member>  
<rdf:seq>  
<rdf:li>Nguyn A</rdf:li>  
<rdf:li>Nguyn B</rdf:li>  
<rdf:li>Nguyn C</rdf:li>  
<rdf:li>Nguyn D</rdf:li>  
</rdf:seq>  
</class:member>  
</rdf:Description>  
13  
</rdf:RDF>  
<rdf:Alt> là một danh sách các tài nguyên hoặc các giá trị, được dùng để biểu  
diễn các giá trị lựa chọn của một thuộc tính (người dùng chỉ có thể được lựa chọn  
một trong các giá trị đó).  
Ví d:  
<?xml version="1.0"?>  
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
xmlns: paper ="http://www.abc.vn/paper#">  
<rdf:Description rdf:about="http://www.semlib.com/database/dbs">  
< paper:format>  
<rdf:Alt>  
<rdf:li>pdf</rdf:li>  
<rdf:li>doc</rdf:li>  
<rdf:li>latex</rdf:li>  
</rdf:Alt>  
</paper:format>  
</rdf:Description>  
</rdf:RDF>  
. Tp hp RDF  
Tập hợp RDF (Collection RDF) được sử dụng để mô tả các nhóm chỉ chứa  
những thành viên đã được đặc tả. Như ta đã biết, trong RDF, một bộ chứa RDF cho  
thấy các thành viên của nó là các nguồn tài nguyên, nó không cho biết rằng những  
thành viên nào không được phép.  
Một tập hợp được mô tả bởi thuộc tính rdf:parseType="Collection".  
Ví d:  
<?xml version="1.0"?>  
<rdf:RDF  
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
xmlns: paper ="http://www.abc.vn/paper#">  
<rdf:Description  
rdf:about=" http://www.semlib.com/database">  
<paper:sub rdf:parseType="Collection">  
<rdf:Description rdf:about="http://www.semlib.com/database/relativedb"/>  
<rdf:Description rdf:about="http://www.semlib.com/database/activedb"/>  
14  
<rdf:Description rdf:about=" http://www.semlib.com/database/objectdb"/>  
<rdf:Description rdf:about="http://www.semlib.com/database/xmldb"/>  
</ paper:sub>  
</rdf:Description>  
</rdf:RDF>  
1.3.2 Bản thlun  
Trong khoa học máy tính, một bản thlun là một mô hình dữ liệu biểu diễn  
một lĩnh vực và được sử dụng để suy luận về các đối tượng trong lĩnh vực đó và  
mối quan hệ giữa chúng. Bản thlun cung cấp một bộ từ vựng chung bao gồm các  
khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái niệm và các  
thuộc tính này. Ngoài bộ từ vựng, bản thlun còn cung cấp các ràng buộc, đôi khi  
các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ từ  
vựng, nó được sử dụng trong một miền mà có thể được giao tiếp giữa người và các  
hệ thống ứng dụng phân tán hỗn tạp khác.  
Bản thlun được xem là “trục xương sống” của Semantic Web. Danh sách  
dưới đây sphân tích vai trò của ontology trong ngữ cảnh ứng dụng Web có ngữ  
nghĩa.  
. Chia sẻ sự hiểu biết chung giữa các ứng dụng và con người..  
. Cho phép sử dụng lại tri thức. Ví dụ, nếu một bản thlun đã được phát  
triển các ng dụng có thsử dụng lại.  
. Đưa ra các giả thiết rõ ràng về miền: Đặc tả rõ ràng về miền tri thức sẽ  
giúp cho người mới dễ tìm hiểu ngữ nghĩa của miền lĩnh vực.  
. Phân tách tri thức lĩnh vực với tri thức thao tác.  
. Phân tích tri thức lĩnh vực. Phân tích hình thức của các khái niệm, cần  
thiết cho việc tái sử dụng và mở rộng ontology.  
Btừ vựng bản thluận được xây dựng trên cơ sở của cơ cấu mô tả tài nguyên  
(RDF) và lược đồ RDF, nó cung cấp khả năng biểu diễn ngữ nghĩa mềm dẻo cho tài  
nguyên Web và có khả năng hỗ trợ lập luận.  
Có một số kỹ thuật lập mô hình và biểu diễn bản thlun như frames, logic  
bc nht, logic mô tả, nghphần mềm, ... Mặc dù các kỹ thuật này có thể biểu  
diễn cùng một cơ sở tri thức với các mức độ hình thức và chi tiết khác nhau, nhưng  
chúng đều có cùng các thành phần cơ bản sau:  
15  
i. Các cá th– Thhin  
Các cá thể là các thành phần cơ bản của một bản thlun. Các cá thể trong  
một bản thlun có thcác đối tượng cụ thể như con người, động vật, máy tính...  
cũng có thể là các đối tượng trừu tượng như các thành viên trong một tổ chức nào  
đó, hay một từ ngữ nào đó. Một bản thể luận có thể không cần có một cá thể nào.  
ii. Các lớp – Khái niệm  
Các lớp là các nhóm, tập hợp các đối tượng trừu tượng. Chúng có thể chứa các  
cá thể, các lớp khác, hay là sự phối hợp của cả hai.  
Các bản thlun biến đổi tuỳ thuộc vào cấu trúc và nội dung của nó: Một lớp  
có thể chứa các lớp con, có thể là một lớp tổng quan (chứa tất cả mọi thứ), có thể là  
lớp chỉ chứa những cá thể riêng lẻ. Một lớp có thể xếp gộp vào hoặc bị xếp gộp vào  
bởi các lớp khác. Mối quan hệ xếp gộp này được sử dụng để tạo ra một cấu trúc có  
thứ bậc các lớp, thường là với một lớp thông dụng nhất kiểu  
iii. Các thuộc tính  
Các đối tượng trong ontology có thể được mô tả thông qua việc khai báo các  
thuộc tính của chúng. Mỗi một thuộc tính đều có tên và giá trị của thuộc tính đó.  
Các thuộc tính được sử dụng để lưu trữ các thông tin mà đối tượng có thể có. Ví dụ,  
đối với một cá nhân có thể có các thuộc tính: Họ_tên, ngày_sinh, quê_quán,  
số_cmnd…  
Giá trị của một thuộc tính có thể có các kiểu dữ liệu phức tạp.  
iv. Các mối quan hệ  
Một trong những ứng dụng quan trọng của việc sử dụng các thuộc tính là để  
mô tả mối liên hệ giữa các đối tượng trong ontology.  
Một kiểu quan hệ quan trọng là kiểu quan hệ xếp gộp (subsumption). Kiểu  
quan hệ này mô tả các đối tượng nào là các thành viên của các lớp nào.  
1.3.3 Lược đồ RDF và truy vn RDF  
1.3.3.1 Lược đồ RDF  
RDF cung cấp một cách để mô tả các phát biểu đơn giản về các resource, sử  
dụng các thuộc tính và giá trị đã được định nghĩa trước. Tuy nhiên, RDF chỉ cho  
16  
phép định nghĩa các quan h, chkhông nói rõ chỉ có thể có các loại quan hệ nào,  
hay các kiểu đối tượng có thể có trong min hin tại. Để làm được điều này, chúng  
ta sẽ phải sử dụng một phiên bản mở rộng của RDF, gọi là lược đồ RDF (RDF  
Scheme - RDFS). Lược đồ RDF là mt ngôn ngữ bản thlun dạng đơn nhất, nó  
cung cấp một khung để mô tả các lớp, thuộc tính của ứng dụng cụ thể. Các lớp  
trong RDFS giống như các lớp trong lập trình hướng đối tượng, cho phép các tài  
nguyên được định nghĩa như là một thực thể của lớp, hay lớp con của lớp.  
Để thực hiện phân chia các lớp và các lớp con, RDFS sử dụng các phần tử  
như: rdfs:Class và rdfs:subClassOf.  
Ví d: Xét lược đồ sau: lp B là con của lp A  
Hình 1.3. Quan hệ kế thừa  
Sử dụng RDFS để định nghĩa, chú thích các mối quan hệ trên, ta có:  
<?xml version="1.0"?>  
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"  
xml:base="http://www.javasample.net/oop#">  
<rdf:Description rdf:ID="classA">  
<rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>  
</rdf:Description>  
<rdf:Description rdf:ID="classB">  
<rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>  
<rdfs:subClassOf rdf:resource="#classA"/>  
</rdf:Description>  
</rdf:RDF>  
Khi lp RDFS là tài nguyên RDF, ta có thể dùng rdfs:Class thay vì dùng  
rdf:Description, ví dụ trên được viết lại:  
<?xml version="1.0"?>  
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
17  
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"  
xml:base="http://www.javasample.net/oop#">  
<rdfs:Class rdf:ID="classA"/>  
<rdfs:Class rdf:ID="classB">  
<rdfs:subClassOf rdf:resource="#classA"/>  
</rdfs:Class>  
</rdf:RDF>  
i. Định nghĩa lp  
Các tài nguyên trên Web có thể chia thành các nhóm gọi là lp. Các thành  
viên của nhóm được xem như là thể hiện của lớp đó. Thông qua các định danh URI,  
các tài nguyên được truy xuất và có thể được mô tả bằng các thuc tinh RDF. Thuộc  
tính rdf: type được sử dụng để chỉ ra một tài nguyên là một thể hiện của một lp.  
Bảng 1. Các lớp trong RDFS [1]  
Lp con của  
Kiu  
Phn tử  
tả  
(rdfs:subClassOf)  
(rdf:type)  
rdfs:Resource  
rdfs:Class  
Tt cả các tài nguyên  
Tt cả các lp  
Giá trị đơn giản  
Kiu dliu  
rdfs:Resource  
rdfs:Resource  
rdfs:Resource  
rdfs:Class  
rdfs:Class  
rdfs:Class  
rdfs:Class  
rdfs:Class  
rdfs:Datatype  
rdfs:Class  
rdfs:Class  
rdfs:Class  
rdfs:Class  
rdfs:Literal  
rdfs:Datatype  
rdf:XMLLiteral  
rdf:Property  
rdf:Statement  
rdf:List  
Giá trị đơn giản XML  
Các thuc tính  
Các khai báo  
rdfs:Literal  
rdfs:Resource  
rdfs:Resource  
rdfs:Resource  
rdfs:Resource  
Các danh sách  
Container  
rdfs:Container  
rdf:Bag  
Container không có thtrdfs:Container rdfs:Class  
rdf:Seq  
Container có thtự  
Container thay thế  
rdfs:Container rdfs:Class  
rdfs:Container rdfs:Class  
rdf:Alt  
rdfs:Container  
MembershipProperty  
Thuc tính quan hệ thành  
viên  
rdf:Property  
rdfs:Class  
18  
ii. Định nghĩa thuc tính  
Mô tả các tính chất của khái niệm. Lược đồ RDF cung cấp một bộ từ vựng để  
mô tlàm thế nào mà các thuộc tính và lớp có thể được sử dụng cùng nhau trong  
RDF.  
Bảng 2. Các thuộc tính trong RDFS [1]  
Phn tử  
rdfs:range  
tả  
Hạn chế các đối tượng  
Hạn chế các đối tượng  
Thhin của  
rdfs:domain  
rdf:Property  
rdf:Property  
rdfs:range  
rdfs:Class  
rdfs:domain  
rdf:type  
rdfs:Class  
rdfs: Resource rdfs:Class  
rdfs:subClassOf  
Lp con của  
rdfs:Class  
rdfs:Class  
rdfs:subPropertyOf Thuc tính con của  
rdf:Property  
rdf:Property  
Nhãn có nghĩa (dành cho  
rdfs:label  
rdfs: Resource rdfs:Literal  
người dùng dhiu)  
Li chú giải (dành cho  
rdfs:comment  
rdfs: Resource rdfs:Literal  
người dùng dhiu)  
rdfs:member  
rdf:first  
Thành viên của container  
Phn tử đu tiên  
rdfs: Resource rdfs: Resource  
rdf:List  
rdfs: Resource  
rdf:List  
rdf:rest  
Phn còn lại của danh sách rdf:List  
rdf:_1, rdf_2  
Thành viên của Container  
rdfs:Container rdfs: Resource  
rdfs:seeAlso  
rdfs:isDefineBy  
rdf:value  
Thông tin xem thêm  
Định nghĩa bi  
rdfs: Resource rdfs: Resource  
rdfs: Resource rdfs: Resource  
rdfs: Resource rdfs: Resource  
Các giá trị có cu trúc  
Đối tượng của khai báo  
Predicate khai báo  
Chủ thể của khai báo  
rdf:object  
rdf:Statement  
rdf:Statement  
rdf:Statement  
rdfs: Resource  
rdfs: Resource  
rdfs: Resource  
rdf:predicate  
rdf:subject  
Thuộc tính quan trọng nhất được sử dụng trong trường hợp này là rdfs:range  
và rdfs:domain  
19  

Tải về để xem bản đầy đủ

pdf 68 trang yennguyen 06/05/2025 290
Bạn đang xem 30 trang mẫu của tài liệu "Luận văn Ứng dụng web ngữ nghĩa trong lưu trữ và quản lý các tài liệu số", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfluan_van_ung_dung_web_ngu_nghia_trong_luu_tru_va_quan_ly_cac.pdf