Khóa luận Nghiên cứu giải pháp tìm kiếm tài nguyên hiệu quả theo tên miền trên mạng ngang hàng có cấu trúc

ĐẠI HC QUC GIA HÀ NI  
TRƯỜNG ĐẠI HC CÔNG NGHỆ  
Đỗ Vit Kiên  
NGHIÊN CU GII PHÁP TÌM KIM TÀI NGUYÊN  
HIU QUTHEO TÊN MIN TRÊN MNG NGANG  
HÀNG CÓ CU TRÚC  
KHOÁ LUN TT NGHIP ĐẠI HC HCHÍNH QUY  
Ngành: Công nghThông tin  
Cán bhướng dn: TS. Nguyn Hoài Sơn  
HÀ NI - 2010  
LI CM ƠN  
Em xin chân thành cm ơn các thy cô giáo trong trường Đại hc Công ngh-  
Đại hc Quc gia Hà Ni đã tn tình giúp đỡ và truyn đạt kiến thc cho em trong sut  
4 năm hc qua để em có đủ kiến thc hoàn thành khóa lun này.  
Đặc bit, em xin gi li cm ơn sâu sc ti thy Nguyn Hoài Sơn – người đã  
nhit tình giúp đỡ, định hướng cũng như động viên em trong quá trình nghiên cu và  
hoàn thành khóa lun.  
Em xin cm ơn snhit tình chia skinh nghim, đóng góp ý kiến ca nhóm  
nghiên cu do thy Nguyn Hoài Sơn hướng dn, ca các anh chcao hc.  
Mc dù đã rt cgng hoàn thành khóa lun này, xong khóa lun skhó tránh  
khi nhng thiếu sót, kính mong quý thy cô tn tình chbo giúp em. Mt ln na em  
xin cm ơn tt cmi người.  
Hà Ni, tháng 5 năm 2010  
Sinh viên  
Đỗ Vit Kiên  
Tóm tt  
Ngày nay, sphát trin các dch vcung cp tài nguyên mng khiến cho vic xây  
dng mt hthng có khnăng tìm kiếm nhanh các tài nguyên theo yêu cu là rt cn  
thiết. Thách thc đặt ra là làm sao để hthng có thhot động tt trong nhng hệ  
thng mng quy mô ln nhưng tim tàng nhiu biến động. Mt mi quan tâm khác là  
bng cách nào người dùng có thdin tvà tìm kiếm được tài nguyên mà hmong  
mun.  
Khóa lun strình bày mt gii pháp tìm kiếm thông tin trên hthng mng  
ngang hàng vi thành phn là các máy phân tích, đóng vai trò như nhng kho dliu  
lưu trtài nguyên và xlý các yêu cu tìm kiếm. Gii pháp thc thi vic mô ttài  
nguyên bng mt câu trúc cây thuc tính-giá trcó khnăng biu din cao, mô tmm  
dèo và chính xác tài nguyên. Tng phDHT vi cơ chế ánh xkhóa đến dliu được  
sdng giúp hthng đạt hiu qutrong vic tìm kiếm nhanh và mrng quy mô.  
Tuy nhiên, để htrvic tìm kiếm mrng sdng truy vn tng quát, gii pháp sẽ  
cung cp thêm khnăng ánh xtdi khóa đến tp hp tài nguyên để cái tiến cơ chế  
mt – mt ca các mng DHT. Ngoài ra hthng cũng gii quyết được vn đề cân  
bng lưu trtrên các máy phân tích.  
Mc lc  
Mở đầu ........................................................................................................................3  
Chương 1. Tng quan vtìm kiếm tài nguyên mng....................................................6  
1.1. Tm quan trng ca tài nguyên và các dch vcung cp tài nguyên................6  
1.2. Tng quan hthng tìm kiếm tài nguyên mng ..............................................7  
1.2.1. Gii thiu...................................................................................................7  
1.2.2. Din đạt tài nguyên....................................................................................7  
1.2.3. Kiến trúc hthng ...................................................................................10  
1.2.4. Tìm kiếm và phân btài nguyên..............................................................12  
1.2.5. Đánh giá chung........................................................................................16  
Chương 2. Tìm kiếm tài nguyên trên mng ngang hàng có cu trúc...........................17  
2.1. Tng quan vmng ngang hàng ...................................................................17  
2.1.1. Khái nim mng ngang hàng....................................................................17  
2.1.2. Đánh giá ưu nhược đim ca mng ngang hàng.......................................18  
2.2. Mng ngang hàng có cu trúc .......................................................................19  
2.2.1. Kiến trúc mng ........................................................................................19  
2.2.2. Giao thc Chord ......................................................................................20  
Mô hình mng Chord ..........................................................................................21  
Ánh xkhóa vào mt nút trong Chord.................................................................22  
Tìm kiếm trong mng Chord ...............................................................................22  
Tham gia và n định mng ..................................................................................23  
2.3. Mt sgii pháp vtìm kiếm tài nguyên trên mng ngang hàng có cu trúc. 23  
2.3.1. Hthng INS/TWINE .............................................................................24  
2.3.2. Data Indexing[4] .......................................................................................28  
3.1. Vn đề gii quyết..........................................................................................32  
3.2. Ý tưởng ........................................................................................................34  
3.3. Chi tiết gii pháp ..........................................................................................39  
3.4. Đánh giá chung vgii pháp.........................................................................43  
4.1. Môi trường mô phng...................................................................................44  
4.1.1. Xây dng chương trình mô phng............................................................44  
4.1.2. Các tham smô phng.............................................................................45  
4.2. Đánh giá kết qu...........................................................................................47  
4.2.1. Hiu qutrong phân btài nguyên...........................................................47  
4.2.2. Hiu qutrong xlý truy vn ..................................................................52  
5.1. Kết lun........................................................................................................55  
5.2. Hướng phát trin tiếp theo ca đề tài ............................................................56  
Tài liu tham kho .....................................................................................................57  
Danh mc hình nh  
Hình 1: Mô ttài nguyên dưới dng cây......................................................................9  
Hình 2:Mô ttài nguyên dưới dng các cp th[thuc tính = giá tr].......................10  
Hình 3: Sơ đồ kiến trúc mng INS..............................................................................11  
Hình 4:Ví dvvic phân btài nguyên trong hthng............................................14  
Hình 5 :Thut toán tìm kiếm tài nguyên theo tên min ...............................................15  
Hình 9 : Mt mng Chord vi 3 nút...........................................................................21  
Hình 10. Lưu gikey trong mng Chord....................................................................22  
Hình 11: Ví dvmô ttài nguyên trong INS/TWINE...............................................24  
Hình 12: Kiến trúc ca hthng INS/TWINE ............................................................25  
Hình 13: Ví dvvic chia nhánh tcây avtree........................................................25  
Hình 14: Vic qun lý trng thái trong hthông INS/Twine.......................................27  
Hình 15 Ví dvề đặc tfile trong hthng Indexing ................................................28  
Hình 16: Đồ thbiu din các câu truy vn được đưa ra trong ví d.........................29  
Hình 17 : Lược đồ chmc cho dliu cây thư mc (bibliographic database)...........30  
Hình 18 : Ví dvindex dliu.................................................................................31  
Hình 19: Ví dvmô ttài nguyên ca hthng.......................................................35  
Hình 21 : Ví dvmô ttruy vn trong gii pháp .....................................................41  
Hình 22: Biu đồ phân tích slượng bn sao thc hin trên mi tài nguyên, trường  
hp cây mô tchung chia 2 nhánh ti mi nút...........................................................48  
Hình 23 :Biu đồ phân tích slượng bn sao thc hin trên mi tài nguyên, trường  
hp cây mô tchung chia 3 nhánh ti mi nút...........................................................49  
Hình 24: Biu đồ phân tích slượng bn sao lưu trên mi nút mng, trong trường  
hp cây mô tchung chia 2 nhánh ti mi nút...........................................................50  
1
Hình 25: Biu đồ phân tích slượng bn sao lưu trên mi nút mng, trong trường  
hp cây mô tchung chia 4 nhánh ti mi nút...........................................................51  
Hình 26 : Biu đồ phân tích slượng bn sao lưu trên mi nút mng, trong trường  
hp cây mô tchung chia 6 nhánh ti mi nút...........................................................52  
Hình 27: Biu đồ đánh giá hiu quca truy vn thông qua slượng các hope trên  
mi truy vn...............................................................................................................53  
Hình 28: Biu đồ đánh giá hiu quca vic thc hin truy vn thông qua slượng  
truy vn / 1 nút mng.................................................................................................54  
2
Mở đầu  
Trong nhng năm gn đây, Internet đã không còn xa lạ đối vi đời sng con  
người. Sphát trin và ln mnh ca Internet giúp cho con người có thtrao đổi,chia  
sthông tin hay tài nguyên mt cách ddàng hơn. Tuy nhiên lượng thông tin là vô  
cùng ln và không phi thông tin nào cũng hu ích đối vi tt cmi người, mi mt  
cá nhân khác nhau có nhu cu vthông tin khác nhau. Do đó vic xây dng mt hệ  
thng tìm kiếm thông tin, tài nguyên mng là rt cn thiết.  
Các máy tìm kiếm phbiết nht có thkể đến đó là Google[15], Yahoo[16], ngoài  
ra còn rt nhiu nhng hthng tìm kiếm tương tkhác. Đim chung ca các hthng  
này là chhtrvic tìm kiếm da tkhóa xut hin trên ni dung ca các websites.  
Chúng không cung cp khnăng tìm kiếm thông tin đối vi nhiu loi tài nguyên khác  
nhau như các dch vcung cp thông tin trc tuyến, hay mt dng tài nguyên rt phổ  
biến khác đó là các files tài nguyên được chia strên mng ngang hàng. Hthng  
DNS[9] có thể được xem là mt hthng tìm kiếm tài nguyên đơn gin, ánh xtên  
min ti IP. Nhưng mô ttài nguyên trong hthng này là chưa hiu quvi nhng tài  
nguyên phc tp có nhiu thuc tính.  
Vic xây dng mt hthng tìm kiếm tài nguyên là không hề đơn gin, nó phi  
chu stác động trt nhiu yếu t. Trước tiên, hthng luôn phi chu tác động ca  
sthay đổi động trong trong các hthng mng, ví dnhư : vic ra vào ca các nút,  
thay đổi vtrí, địa chca các thiết b... Sthay đổi thường xuyên trong nhng mng  
như vy là thách thc vi vic định vthiết bvà tài nguyên trong quá trình tìm kiếm.  
Thhai, là thách thc trong vic lưu trslượng ln tài nguyên trong hthng. Vi  
sphát trin vslượng các dch vtheo nhu cu ca người sdng thì slượng tài  
nguyên cũng không ngng tăng lên và vic phân blưu trchúng hp lý slà mt vn  
đề quan trng. Thêm vào đó các tài nguyên cũng cn được cp nht thường xuyên và  
hthng cn phi có cơ chế giúp các nhà cung cp dch vthc hin điu này.  
Để xây dng được mt hthng hot động hiu qu, hthng cn hin được mt  
syêu cu quan trng. Thnht, cn có mt các thc mô ttài nguyên tt, mang tính  
biu đạt cao, có thdin đạt mm do các tích cht đa dng ca tài nguyên. Thhai,  
hthng phi có khnăng mrng tt để có thtrin khai trên nhng quy mô mng  
ln. Thba, hthng phi đảm bo hiu qutrong tìm kiếm và phân btài nguyên.  
Hiu qutrong tìm kiếm được đánh giá qua thi gian thc hin yêu cu và vic cân  
bng ti gia các nút trong hthng trước nhiu yêu cu vtìm kiếm. Hiu qutrong  
phân btài nguyên được đánh giá thông qua slượng bn sao so vi tài nguyên thc  
3
và cân bng lưu trtài nguyên gia các nút mng. Cui cùng, cn phi luôn đảm bo  
tính sn sàng ca hthng trước nhng vn đề vhng hóc, bo trì, hay cp nht thiết  
b.  
Khóa lun sẽ đưa ra mt gii pháp cthda trên nhng lun đim trên... Mt hệ  
thng có khnăng din đạt tài nguyên tt đó là hthng INS vi vic sdng bộ định  
danh để biu din các cp thuc tính – giá trmt cách có tht, theo cu trúc phân  
cp. Mi mt mô tđược khi sdng bộ định danh stương đương vi mt cây  
thuc tính – giá tr.  
Để đảm bo khnăng tìm kiếm và phân bhiu quhthng đề xut vic sử  
dng mng ngang hàng có cu trúc. Trong mng ngang hàng có cu trúc, các thông  
đip được định tuyến theo khóa mt cách hiu quvi shop khong O(logN) trong  
đó N là snode trong mng. Các ưu đim khác ca mng này là đem li cho hthng  
khnăng mrng, tính sn sàng trong các trường hp xlý li và đảm bo cân bng  
ti gia các nút. Tuy nhiên, gii thut bng băm phân tán chhtrtìm kiếm chính xác  
tài nguyên theo khóa tương ng, trong khi đó hthng ca chúng ta cn có khnăng  
trli nhng truy vn theo di (partial query).  
Khóa lun đề xut vic tìm kiếm theo di ID, vic thc hin bng cách xây dng  
mt cu trúc cây lưu trda trên di ID cp phát bi mng ngang hàng phía dưới.  
Vic xây dng như sau, ti tng đầu nút root ca cây squn lý toàn bdi ID, các  
tng tiếp theo, di ID được chia nhcho các nút con qun lý, thông tin vtài nguyên  
thc schỉ được lưu ti các nút lá. Nhờ đó, khi tìm kiếm đến mt nút hthng sánh  
xạ đến di ID mà nó qun lý, nếu nút không phi nút lá, di ID ca nó scha toàn bộ  
di ID ca các nút lá nhờ đó vic tìm kiếm trên di ID này scho kết qulà tp hp  
các tài nguyên tha mãn yêu cu cha ti các nút lá. Vic sdng di ID để ánh xạ  
còn giúp hthng chng chu tt hơn vi vic hng hóc ca các nút mng, khi mt nút  
mng ri đi các nút mng cùng di ID vn có thtrli kết qu.  
Để đánh giá hiu quca gii pháp đề xut, khóa lun xây dng mt chương  
trình mô phng vi slượng ln các nút mng o và tài nguyên o. Các kết quthử  
nghim schng minh cho hiu quca gii pháp đề ra.  
Khóa lun được chia thành năm chương:  
Chương 1: Gii thiu tng quan vtm quan trng ca tài nguyên và các dch vụ  
cung cp tài nguyên, sơ lược vmt hthng tìm kiếm tài nguyên mng  
4
Chương 2: Đề cp đến vic thc hin hthng tìm kiếm tài nguyên trên mng  
ngang hàng có cu trúc, ưu đim ca nó và gii thiu mt shthng đã được thc thi.  
Chương 3: Tcác hthng và phương pháp gii quyết đã được trình bày trong 2  
chương trước đưa ra các đánh giá chung và mc tiêu phát trin. Trên cơ sở đó đề đạt ý  
tưởng và gii pháp để xây dng hthng chia stài nguyên.  
Chương 4: Xây dng chương trình mô phng, các bước thc thi chương trình và  
nhng đánh giá tkết quả đạt được.  
Chương 5: Kết lun, nhng vn đề ny sinh và hướng đi tiếp theo.  
5
Chương 1. Tng quan vtìm kiếm tài nguyên mng  
Tìm kiếm tài nguyên hay thut ngtiếng anh là Resource Discovery đã được sử  
dng tlâu trên các hthng mng đặc biết là trong mng Internet ngày nay. Trong nỗ  
lc khiến cho vic tìm kiếm tài nguyên mng trnên dsdng vi người dùng nhiu  
hthng tìm kiếm trong lĩnh vc này đã được ra đời.  
Chương này, khóa lun sgii thiu tng quan vthế nào là tài nguyên mng và  
tm quan trng ca chúng cũng như các dch vcung cp chúng, các vn đề trong vic  
xây dng mt hthng tìm kiếm tài nguyên, nhng tiêu chí được đề ra cho mt hệ  
thng được cho là hoàn chnh.  
1.1. Tm quan trng ca tài nguyên và các dch vcung cp tài  
nguyên.  
Định nghĩa  
Tài nguyên mng, là nhng thtrc tiếp cung cp thông tin hay khnăng sử  
dng đối vi mt người dùng mng. Mi tài nguyên đều được định nghĩa bi mt tp  
hp các thuc tính. Mi thuc tính thhin mt tính cht ca tài nguyên, có thlà các  
tính cht vhình dng như chiu dài, chiu rng, … cũng có thlà các tính cht về  
cht liu hay các mi quan hphthuc. Các tài nguyên mng phbiến nht gm các  
tài nguyên mm như là tp tin, tt ccác dng như âm thanh, hình nh, dliu,... hoc  
các tài nguyên phn cng như camera, máy in, …  
Tm quan trng ca tài nguyên  
Vi sphát trin ca công nghthông tin ngày nay, đặc bit là sphát trin ca  
các mng không dây và di động khiến cho nhu cu vthông tin ca con người cũng  
phát trin mnh mhơn. Con người có ththa mãn nhu cu thông tin mi nơi và  
mi lúc chvi mt thiết bdi động trong tay, các hình thc ca thông tin cũng đa  
dng hơn rt nhiu, tdliu vchviết đến hình nh hay thm chí là video cũng trở  
nên thường xuyên hơn.  
Tnhu cu thông tin ca con người các dch vcung cp chúng được phát trin  
nhanh chóng cvcht lượng ln slượng, các dch vnày tp trung vào khai thác  
nhng nhu cu tìm kiếm thông tin ca con người trong cuc sng, và truyn ti nó  
thông qua các hthng mng mà đin hình là các mng di động. Mt ví dụ đin hình  
như dch vcung cp hình nh được truyn ti tcamera giao thông trong mt thành  
ph, các hình nh vtình trng giao thông trên các tuyến đường, sctc nghn hay  
6
các thông tin liên quan. Qua đó có ththy tm quan trng ca các dch vcung cp  
tài nguyên là rt quan trng đối vi cuc sng hin đại ngày nay. Vn đề là làm sao để  
thc hin được mt hthng cung cp hiu qunhưng vn phi mang tính thun tin  
vi người sdng.  
1.2. Tng quan hthng tìm kiếm tài nguyên mng  
Như đã trình bày trong phn trước, vic xây dng và cung cp mt hthng tìm  
kiếm tài nguyên là rt quan trng, trong phn này ta strình bày cthế vmt hệ  
thng hoàn chnh.  
1.2.1. Gii thiu  
Mt hthng tìm kiếm tài nguyên hoàn chnh đòi hi rt nhiu tiêu chí, các  
tiêu chí đánh giá nhm giúp hthng có được hiu qutrong vic trin khai thc  
tế. Da trên cơ bn vmôi trường thc thi và các ng dng ca hthng, hệ  
thng được xây dng theo 4 tiêu chí :  
Tính din đạt : hthng tên min sdng phi tht slinh hot để có  
thvn dng trên các thiết bdi động và các dch vkhác nhau nhưng  
vn phi đảm bo khnăng din đạt mt cách mm do và chính xác  
các tài nguyên trong hthng cũng như các truy vn dùng khi tìm  
kiếm.  
Phn hi nhanh : hthng cn có đáp ng nhanh các yêu cu vtìm  
kiếm cũng như yêu cu chia stài nguyên mi.  
Tính vng chc : hthng cn phi có khnăng n định khi gp các  
vn đề vti và lưu lượng đường truyn trên mng, ngoài ra khnăng  
phc hi li và sa cha nhanh là rt quan trng.  
Dcài đặt : hthng nên mang tính tự động và gim thiu các yêu  
cu can thip tbên ngoài mc thp nht.  
1.2.2. Din đạt tài nguyên  
Các vn đề trong din ttài nguyên  
Các ng dng trong môi trường mng thông thường không thbiết được  
chính xác vtrí mng có ththa mãn được yêu cu thông tin ca nó. Do đó  
chúng ta stp trung vào gii quyết vn đề làm sao cho các ng dng này có thể  
din tả được chúng “tìm kiếm cái gì?” thay cho vic “tìm kiếm ở đâu?”. Vy làm  
7
sao để din tchính xác và hiu quả được nhng tài nguyên mà ng dng tìm  
kiếm?  
Hthng INS[2] đã đưa ra gii pháp rt tt để gii quyết cho vn đề này. Hệ  
thng INS hay chính xác là Intentional Naming System là mt thiết kế và thc thi  
ca mt hthng tìm kiếm tài nguyên và dch vtrên các môi trường mng có  
tính biến thiên cao. INS sdng tên min khái nim để din đạt tài nguyên và  
ánh xttên min đến tài nguyên được ct gitrong hthng. INS sdng mt  
ngôn ngữ đặc trưng để din đạt tài nguyên có tên gi là Intentional Naming  
Language. Vcơ bn, ngôn ngnày da trên hthng thbc các cp thuc tính  
và giá tr. Điu này cho phép các nhà cung cp dch vcó thdin đạt chính xác  
thhcung cp và phía người dùng có thdin tchính xác thhyêu cu.  
Vic tìm kiếm tài nguyên da trên các mô tcòn cho phép các ng dng sử  
dng INS có khnăng duy trì tìm kiếm ngay ckhi ví trí ca các thiết btham gia  
mng thay đổi, điu thường xuyên din ra ti các môi trường mng có tính biến  
thiên ln như các mng không dây và di động.  
Để có thphn hi nhanh trước các truy vn tìm kiếm, hthng INS không  
chsdng tên min để tìm kiếm tài nguyên (hay dch v) mà còn sdng chúng  
để định tuyến các thông đip truy vn, vic định tuyến này cn được phân bit  
vi định tuyến tng mng. Các máy phân tích da vào tên min được sdng  
để định danh ra các máy phân tích khác mà nó có thông tin (Các thông tin có thể  
là : địa chIP, thông tin vtên min lưu tr, …) và chuyn tiếp thông đip đến  
các máy phân tích này.  
Bộ định danh  
Được INS dùng để đánh tên min, bộ định danh được các máy khách sử  
dng trong trường tiêu đề ca thông đip gi đi trong hthng. Tcác tên min  
được mô t, thông đip nhn biết được đích đến cũng như ngun gc ca thông  
đip.  
Bộ định danh được thiết kết đơn gin và ddàng để thc thi. Hai phn  
chính trong bộ định danh đó là “thuc tính” và “giá tr”. Mt “thuc tính” là mt  
tiêu chí được sdng để phân loi đối tượng (ví d: thuc tính có thlà màu sc).  
“giá tr” chính là giá trđối tượng nhn được trong tiêu chí đánh giá đó (ví  
d: giá trtrong trường hp này là đỏ). Thuc tính và giá trị đều được biu din  
8
dưới dng mt xâu kí tbt biến được định nghĩa bi ng dng. Mi mt thuc  
tính cùng vi giá trtương ng vi nó to thành mt cp thuc tính giá tr.  
Mi mt định danh là mt ssp đặt theo thbc ca các cp thuc tính và  
giá trí qua đó các cp thuc tính giá trkế tha (con, cháu) sphthuc vào các  
cp được kế tha (cha, ông) . Như trong hình 1 bên dưới ta thy được “building”  
vi tên gi “whitehouse” hoàn toàn thuc và “city” vi tên gi “washington” do  
đó cp thuc tính giá tr“building-whitehouse” là phthuc vào cp “city-  
washington”. Các cp thuc tính được gi là “trc giao” nếu chúng cùng phụ  
thuc vào mt cp thuc tính khác và là anh em ca nhau trên cây thuc tính –  
giá tr. Trong ví dthhin bộ định danh hình 2, data-type và resolusion có ý  
nghĩa độc lp ln nhau và theo đó 2 cp thuc tính – giá trlà “datatype-picture”  
và “resolusion-640x480” là 2 cp thuc tính - giá tr“trc giao”. Cách mô ttheo  
thtca cây thuc tính – giá trgiúp mt định danh trnên dhiu hơn và làm  
cho vic phân loi tài nguyên hiu quhơn.  
Hình 1: Mô ttài nguyên dưới dng cây  
Mt hình thc mô ttài nguyên khác cũng tra hiu quđơn gin không  
kém được bộ định danh sdng thường xuyên hơn trong các thông đip trao đổi.  
Mô tả được thhin như trong hình 2 dưới dng các thdliu được lng ghép  
9
Hình 2:Mô ttài nguyên dưới dng các cp th[thuc tính = giá tr]  
Vic mô tnhư trong hình 2 vn giữ được hthng thbc đối vi các cp  
thuc tính giá trnhưng ddàng hơn cho máy tính trong quá trình thc hin phân  
tích tài nguyên tbộ định danh.  
1.2.3. Kiến trúc hthng  
Để tìm kiếm và phân btài nguyên hthng cn có mt hthng máy xlý  
các yêu cu ca nhà cung cp dch vvà người sdng. Các hthng xlý  
thường là mt mng phân tán bao gm nhiu máy phân tích tham gia trong vic  
tìm kiếm tên min và chuyn thông đip. Mt cách dthc hin, các máy phân  
tích nên được tự động cu hình, cp nht dliu khi tham gia vào hthng.  
Người dùng hoàn toàn có thđược thông tin mong mun tmt máy phân  
tích bt kì trong hthng.  
Mt tính năng thường thy các hthng tìm kiếm tài nguyên đó là khả  
năng ln mnh và ddàng trin khai trên mng Internet mà không cn thay đổi  
hay loi bbt kì mô hình hay cu trúc mng sn có nào. Các hthng thường  
được xây dng như là mt ng dng đặt trên nn tng ca tng mng, nơi mà các  
thông đip được đánh địa chđịnh tuyến thc s. Các dch vchỉ được phép  
cung cp tài nguyên và thông tin din tchúng, còn người sdng cũng không  
cn quan tâm đến kiến trúc mng cũng như cu hình phía dưới mà trc tiếp tìm  
kiếm tài nguyên da trên các mô tả đặc trưng. ng dng trên các máy phân tích  
sthc hin phân tích tên min theo mô tvà chn gii pháp trli truy vn hoc  
gi đến các máy phân tích khác mà nó có thông tin. Toàn bvic định tuyến và  
đánh địa chỉ đều được thc hin bi tng mng.  
Khóa lun sgii thiu vkiến trúc ca INS như là mt ví dcthcho  
kiến trúc hoàn chnh ca hthng tìm kiếm tài nguyên. Trong INS các ng dng  
có thlà các dch vhoc các ng dng khách hàng, dch vcung cp chc năng  
10  
và dliu, khách hàng yêu cu và truy cp vào dliu thông qua hthng. Kiến  
trúc ca hthng INS như trong hình 3 được chia làm 2 phn chính:  
Trung tâm ca hthng là các máy phân tích (INR)  
Phía rìa ca hthng là các dch vvà các máy khách trc tiếp gi  
yêu cu vqung bá cũng như tìm kiếm tài nguyên trên hthng.  
Hình 3: Sơ đồ kiến trúc mng INS  
Các INRs (Intentional Name Resolovers) mà ta sgi là các “máy phân  
tích” làm nhim vụ định tuyến cho các yêu cu đến được vi các dch vtương  
ng, ti các máy phân tích mt thut toán và giao thc đơn gin sẽ được thc thi  
để đảm bo nó có thhot động tt ngay cvi nhng máy tính có khnăng tính  
toán thp.  
Các máy phân tích làm vic trên tng ng dng phía trên ca mng để trao  
đổi nhng mô tvdch vvà xây dng mt cơ slưu trni b. Mi dch vụ  
gn vi mt máy phân tích bt kì và thông báo cơ sdliu vthuc tính giá tr,  
mô tdch v, ng dng điu khin. Mi máy khách giao tiếp vi mt máy phân  
tích bt kì khác và gi yêu cu vi mt truy vn mô t, do mô tdch vụ được ri  
trên hthng các máy phân tích nên mi dch vmi sẽ được qung bá bi các  
máy phân tích trong hthng và đến được vi máy khách yêu cu dch v.  
Khi mt thông đip được gi tbên ngoài đến mt máy phân tích, yêu cu  
ca thông đip sẽ được xlý trên cơ sca tên đích đến. Máy phân tích squyết  
định xlý trc tiếp yêu cu hay chuyn tiếp xlý sang các máy phân tích khác  
tùy thuc vào đặc tính ca dch vhay tài nguyên được yêu cu. Thông đip  
11  
trong hthng INS có htrcho la chn đặc bit là early-binding flag, khi mt  
thông đip truy vn có sdng la chn này máy phân tích slp tc trvmt  
danh sách các IP tương ng vi tên min được dùng trong truy vn để trli, vi  
danh sách các IP này máy khách có thla chn mt thiết bcui có khong cách  
gn nht để ly dliu hay tài nguyên mà nó tìm kiếm. Trong trường hp xlý  
mun (không sdng la chn early-binding flag) hthng htr2 tùy chn để  
xlý thông đip đó là : intentional anycast và intentional multicast. Chúng sẽ  
giúp cho hthng linh hot hơn trong nhng hoàn cnh thay đổi. Ở đây, các địa  
chIP không được trli trc tiếp cho các máy khách , nhưng thay vào đó yêu  
cu sẽ được chuyn tiếp đến các máy phân tích khác, vi la chn intentional  
anycast nó sgi đến chính xác mt máy phân tích khác có khnăng trli yêu  
cu tt nht, vi la chn còn li yêu cu sẽ được gi đến toàn bcác máy phân  
tích trong danh sách lưu trca máy phân tích đang trli.  
Hthng máy phân tích được tự động cu hình trên cây “spanning tree”  
phtrên topology ca tng mng, ti ưu hóa thi gian trgia các máy phân tích.  
Spanning tree cũng được sdng trong vic qung bá các dch vụ đến các máy  
phân tích trong hthng, hay gi tin nhn tìm kiếm.  
Trong hthng INS, các máy phân tích được ng cvà danh sách các hot  
động mà chúng thc hin được duy trì bi mt đối tượng ca hthng gi là  
Domain Space Resolver (DSR).  
DSR được cho là ging như mt hthng DNS mrng dùng để qun trị  
min đang cha chính bn thân nó bến trong. Khi mt máy phân tích mi mun  
gia nhp và hthng cn được liên htrước vi DSR để ly danh sách các máy  
phân tích đang hot động và sau đó chn ra mt máy phân tích có kết qu“ping”  
đến nó nhnht và công bó làm hàng xóm.  
1.2.4. Tìm kiếm và phân btài nguyên  
Trong phn trước ta đã nói vkiến trúc ca mt hthng tìm kiếm tài  
nguyên, các thành phn hot động trong hthng, công vic mà chúng phtrách  
cũng như mi liên hgia các thành phn. Trong phn này ta strình bày vic  
làm sao để hthng có thphân bvà tìm kiếm tài nguyên trên các máy phân  
tích trong mng phân tích mà ta đã đề cp đến.  
Phân btài nguyên  
12  
Trong hthng, các dch vtheo chu kì qung cáo vtên min mà chúng  
cung cp vi mt trong các máy phân tích, các tài nguyên theo đó được chuyn  
vào hthng cùng vi tên min mô tchúng. Mi máy phân tích lng nghe trên  
mt cng định trước các thông báo để ly thông tin ca các dch vụ đang chy  
trên nhng thiết bcui hay các máy phân tích khác. Các máy phân tích có nhim  
vri rc thông tin vtài nguyên trong mng phân tích. Công vic này được thc  
hin bi 1 giao thc định tuyến kết hp vi định kì cp nht và cp nht khi có  
yêu cu đề cp nht thông tin gia các máy phân tích là hàng xóm ca nhau. Ta  
stìm hiu làm thế nào mt máy phân tích lưu trtài nguyên.  
Vic lưu trtài nguyên sphthuc vào cách thc din ttài nguyên đã  
được đưa ra. Do đó trong khóa lun ta stìm hiu cách thc phân bvà lưu trữ  
tài nguyên da trên mô tđược tbộ định danh ca INS.  
Hthng sdng “name-trees” mà sau này ta sdùng thut ngcây tên  
min để lưu trtương ng gia mt định danh vi mt bn ghi dliu tài nguyên.  
Thông tin chưa trong mt bn ghi dliu bao gm định tuyến đến nhng máy  
phân tích phù hp tiếp theo ( next-hop INR), địa chIP ca đích đến hoc thi  
hn ca bn ghi (khong thi gian tn ti có giá trca bn ghi tài nguyên).  
Cu trúc ca mt cây tên min gn ging cu trúc cây được bộ định danh sử  
dng bao gm các tng luân phiên ca các cp thuc tính – giá tr, nhưng có sự  
khác biết đó là mt thuc tính có thbao gm nhiu giá trtương ng vi nó,  
điu này có thhiu đơn gin khi trong hthng cha nhiu tài nguyên tương tự  
nhau có cùng các tiêu chí đánh giá tương ng vi các thuc tính được mô t,  
nhưng mi tài nguyên li cho mi giá trphân bit ng vi các thuc tính. Mt  
cây tên min slà mt stng hp ca các cây định danh mà máy phân tích biết  
đến. Hình 4 mô tmt cây tên min tương ng vi các bộ định danh mà mt  
trong số đó được mô ttrong hình 1.  
13  
Hình 4:Ví dvvic phân btài nguyên trong hthng  
Tìm kiếm tài nguyên  
Thut toán tìm kiếm theo tên min sdng truy vn là mt định danh có  
được theo cách thc mô tca hthng để tìm chính xác tài nguyên mà định  
danh mô t, định danh sẽ được chuyn đến các máy phân tích, ti các máy phân  
tích cththut toán tìm kiếm ni bsẽ được sdng để tìm ra bn ghi tương  
ng vi tài nguyên. Kết qutng hp ttt ccác máy phân tích trong hthng.  
Trong hình 5 là mô tvthut toán tìm kiếm được sdng trong hthng  
INS, ý tưởng chung ca thut toán này là chuyn tên min tìm kiếm theo kiu  
flooding tmt máy phân tích. Thut toán sdng nhng li gi để quy để gim  
14  
dn slượng các bn ghi phù hp vi truy vn, tp hp các bn ghi được đề cử  
ban đầu là toàn bcác bn ghi có thca hthng (kí hiu tp hp này là S).  
Hình 5 :Thut toán tìm kiếm tài nguyên theo tên min  
Vi mi cp thuc tính – giá trnm trong định danh thut toán sbt đầu  
tìm kiếm vi node thuc tính trong cây tên min ca máy phân tích, nếu node giá  
trtrong bộ định danh mang giá trtdo (thhin bi du *) thì tp hp S sẽ  
được thay thế bi S’ là hp ca tt ccác bn ghi thuc vcây con vi gc là  
node con ca node thuc tính được dùng để bt đầu tìm kiếm. Nếu giá trca  
node thuc tính không mang giá trtdo, thut thoán stiếp tc vi node giá trị  
tương ng vi node thuc tính đã được dùng đến. Khi đó nếu node giá trlà node  
lá ca cây định danh hay cây tên min thut toán strvbn ghi có trong node  
giá trị đang được gi đến. Ngược li thut toán sgi đệ quy đến toàn bcây  
định danh có root là node con ca node giá trị đang được gi đến.  
15  
1.2.5. Đánh giá chung  
Vic phân btài nguyên sẽ đánh giá tính hiu quhu hết các hot động  
ca hthng vì thế người thiết lp hthng cn phi chú trng để xlý tht tt.  
Hthng INS cho thy ưu đim ln trong vic mô ttài nguyên, không chgiúp  
phân loi tài nguyên tt, mà còn có khnăng din đạt tt đối vi cmáy tính và  
con người (nhng người xây dng ng dng). Vic sdng tên min để tìm kiếm  
tài nguyên thay thế cho vic định vchính xác tài nguyên là mt gii pháp tt phù  
hp tính biến động ca kiến trúc mng ngày nay khi phi tích hp vi nhiu thiết  
bdi động có tính biến thiên cao. Có thnói tính năng này ca INS tương đương  
vi vic thay thế câu hi tìm kiếm tài nguyên ở đâu? bng câu hi tìm kiếm cái  
?. Rt đơn gin, chcn đưa ra mô tvtài nguyên mun tìm kiếm hthng sẽ  
tìm kiếm tài nguyên mà không quan tâm đến vic cu trúc mng hay địa chIP  
biến đổi liên tc trong hthng.  
Kiến trúc phân tán đối hthng là không thtách ri. Tuy nhiên hthng  
cn phi có mt thut toán tìm kiếm hiu quhơn là truyn flooding gia các  
máy phân tích. Hthng INS cho thy rõ nhược đim trong trường hp này, nó  
khiến cho khnăng mrng ca hthng sbị ảnh hưởng rt nhiu. Rõ ràng  
vic không có được khnăng mrng là hn chế rt ln, vì các ng dng tìm  
kiếm tài nguyên vi tm quan trng ca nó cn được thc hin trên nhng kiến  
trúc mng ln có thvươn ti tm cnhư mng Internet. Ta hy vng stìm ra  
nhng gii pháp mi cho hthng để hn chế được vn đề này.  
16  
Chương 2. Tìm kiếm tài nguyên trên mng ngang hàng  
có cu trúc  
Trong chương mt, khóa lun đã gii thiu vtm quan trng ca tài nguyên và  
các dch vcung cp chúng đối vi cuc sng công nghthông tin ngày nay. Ngoài ra  
khóa lun cũng đề cp đến các bước trong vic thc hin xây dng hthng tìm kiếm  
tài nguyên mng, bao gm biu din tài nguyên, thiết kế thut toán tìm kiếm và phân  
btài nguyên trong hthng.  
Tiếp theo, chương hai ca khóa lun sẽ đưa ra mt sgii pháp thc thi khác khả  
năng tìm kiếm và phân btài nguyên tương đối hiu qu. Các hthng được trình bày  
đều được đặt trên cơ slà nhng mng ngang hàng có cu trúc, sdng bng băm  
phân tán – DHT[10] để định tuyến các thông đip.  
2.1. Tng quan vmng ngang hàng  
2.1.1. Khái nim mng ngang hàng  
Mng ngang hàng [8], là mng mà trong  
đó hai hay nhiu máy tính chia stp tin và  
truy cp các thiết bnhư máy in mà không  
cn đến máy chhay phn mm máy ch.  
Hay dng đơn gin nht, mng p2p được  
to ra bi hai hay nhiu máy tính được kết  
ni vi nhau và chia stài nguyên mà không  
phi thông qua mt máy chdành riêng.  
Hình 6. Mô hình mng  
Mng ngang hàng có thlà kết ni ti  
ngang hàng  
ch– hai máy tính ni vi nhau qua cng  
USB để truyn tp tin. Mng ngang hàng cũng có thlà cơ shtng thường trc  
kết ni 5, 6 máy tính vi nhau trong mt văn phòng nhbng cáp đồng. Hay nó  
cũng có thlà mt mng có quy mô ln hơn nhiu, dùng các giao thc và ng  
dng đặc bit để thiết lp nhng mi quan htrc tiếp gia người dùng trên  
Internet.  
Cu trúc mng ngang hàng là biu hin ca mt trong nhng khái nim  
quan trng nht ca Internet, mô ttrong "RFC 1, Host Software" xut bn ngày  
7 tháng 4 năm 1969. Gn hơn, khái nim này đã được scông nhn rng rãi  
trong các cu trúc chia sni dung mà không có máy chtrung tâm.  
17  
Mô hình mng ngang hàng (Hình 6)  
không có khái nim máy chvà máy khách, nói  
cách khác, tt ccác máy tham gia đều bình  
đẳng và được gi là peer, là mt nút mng đóng  
vai trò đồng thi là máy khách và máy chủ đối  
vi các máy khác trong mng. Vi mô hình  
khách ch(Hình 7), máy khách gi yêu cu,  
thc hin vic nhn dliu mt chiu tphía  
máy ch.  
Hình 7. Mô hình mng  
khách chủ  
Mng ngang hàng thế hthnht sdng  
mt máy chtrung tâm cho mt stác v. Tiếp đến thế hth2 vi vic ci tiến  
sdng mô hình ngang hàng cho tt ccác tác v, nên các mng này thường  
được xem như là mng ngang hàng đúng nghĩa. Ngày nay thế hmng ngang  
hàng th3 tc mng ngang hàng có cu trúc được chú ý rt nhiu do đặc tính ưu  
vit ca nó so vi các thế htrước. Chi tiết vthế hth3 này sẽ được trình bày  
cthtrong phn sau.  
2.1.2. Đánh giá ưu nhược đim ca mng ngang hàng  
Ưu đim  
Không cn server riêng, các client chia stài nguyên. Khi mng càng được  
mrng thì khnăng hot động ca hthng càng tt. Khc phc nhược đim  
“nút cchai” trong mô hình mng máy khách – máy ch. Thun li cho vic  
chia sfile, máy in, CD-ROM v.v…  
Tính cht phân tán ca mng ngang hàng cũng giúp cho mng hot động tt  
khi mt smáy gp sc. Đối vi cu trúc tp trung, chcn máy chgp scố  
thì chthng sngưng tr.  
Mô hình mng ngang hàng dcài đặt và tchc và qun tr, chi phí thiết bị  
thp. Ngày nay, các máy tính cá nhân đủ mnh để có thlàm nhiu hơn công vic  
ca mt client, do đó khi tham gia vào mng ngang hàng là rt khthi.  
Nhược đim  
18  
Trong mng ngang hàng dliu thường chỉ được chuyn giao trong khong  
thi gian ngn và vi slượng tương đối nh, cht lượng đường truyn chm do  
thường phi chuyn nhng dliu có kích thước ln.  
Các nút đột ngt ri khi mng slàm sai bng định tuyến trong mt thi  
gian nht định, làm cho vic truy vn thiếu chính xác. Dliu mà nút đó phụ  
trách cũng có thbmt theo.  
Kết qutruy vn trvcó thlà rt nhiu và btrùng lp do kết ni đến  
nhiu nút khác nhau, sự đồng bchưa hoàn thin gia các nút. Không tt vi các  
ng dng dùng cơ sdliu. Hơn na sbo mt dliu là kém do dliu bị  
phân tán. Vì thế độ tin cy vdliu trong các mng ngang hàng là không cao.  
2.2. Mng ngang hàng có cu trúc  
Trong phn này ta stìm hiu kĩ hơn vmng ngang hàng có cu trúc - thế hệ  
th3 ca mng ngang hàng vi nhiu ưu đim ni tri. Nó được đánh giá là mt la  
chn hoàn ho cho các hthng ngang hàng hin ti và trong tương lai.  
2.2.1. Kiến trúc mng  
Trong mng ngang hàng có cu trúc các kết ni tng phlà cố định, và  
mng thường sdng bng băm phân tán - DHT[10] để ánh xdliu. Các liên  
kết gia các nút mng trong mng phtuân theo mt thut toán cth, xác định  
cht chmi nút mng schu trách nhim đối vi phn dliu nào được chia sẻ  
trong mng.  
Mng ngang hàng có cu trúc luôn đảm bo mi nút tham gia mng đều có  
thể định tuyến truy vn ti các nút khác cha dliu mong mun, ngay ckhi dữ  
liu đó không phbiến. Ngoài ra, trong mng mt kthut băm phù hp được sử  
dng để gán quyn qun lý dliu cho nhng nút tham gia cth, cũng như bng  
băm truyn thng, mi khóa sẽ được gán cho nhng nút mng cth. Mt số  
mng based-DHT phbiến có thklà: Chord, Pastry, CAN,….  
Bng băm là mt tp hp các cp (khóa, giá tr). Mi mt nút tìm giá trị  
tương ng da vào khóa ca nó. Vic hình thành khóa và gn các khóa đó vi giá  
trtương ng được thc hin trc tiếp ti các nút trong mng, do đó vic ri nút  
hay hng hc không làm nh hưởng nhiu đến hthng. Cng vi vic mi nút  
chlưu thông tin ca xp xlog(N) nút khiến cho khnăng mrng ca mng  
19  
DHT là cc ln, quá trình kim soát vic tham gia, di bmng ca các nút cũng  
trnên ddàng hơn.  
2.2.2. Giao thc Chord  
Chord[1] là mt trong nhng mng DHT phbiến nht, vi nhiu ưu đim  
ni bt. Hai trong số đó là khnăng tìm kiếm dliu nhanh và cân bng ti gia  
các nút. Trong phm vi khóa lun chúng ta chn Chord như đại din thay thế cho  
mng DHT nói chung. Các hthng  
tìm kiếm tài nguyên được ta gii  
thiu và kchthng được đề xut  
trong gii pháp cũng sdng Chord  
làm tng ph(overlay). Hình 8 thể  
hin không gian định danh dng  
vòng (ring) ca Chord.  
Cũng như trong các mng  
ngang hàng có cu trúc khác sphân  
bkhóa trong giao thc Chord  
thường đi kèm vi dliu, thường là  
mt cp (khóa, dliu). Khóa được  
xem như mt công cchỉ đường để có  
thtìm thy dliu mong mun mt  
cách nhanh chóng nht.  
Hình 8: Mng ngang hàng có cu trúc  
Chord dng vòng tròn.  
Hthng Chord là đại din tiêu biu nht ca hthng mng ngang hàng có  
cu trúc DHT, được sdng làm nên tng cho nhiu ng dng phát trin trên  
mng ngang hàng. Mt snghiên cu đã chra rng: Chord không chlà mt  
mng DHT đơn thun mà còn mang nhiu ưu đim khác mà mt smng DHT  
không có. Nhng đặc đim ni bt có thkể đến đó là:  
Khnăng cân bng ti (Load Balance): Quá trình hình thành và phân  
bkhóa ca Chord da trên thut toán Consistent Hashing. Chính nhng  
đặc đim ca thut toán này đã to cho Chord mt khnăng cân bng ti  
mt cách tnhiên ngay khi mng được khi to.  
Sphân quyn: Trong giao thc Chord, các nút được coi như nhau  
không có sphân bit ưu tiên gia các nút, phương pháp phân quyn này  
được thc hin rt hiu qutrong giao thc Chord. Mt smng P2P  
20  
ban đầu cũng có nhng đặc đim tương tnhưng vn tn ti nhng yếu  
đim mà Chord đã khc phc được.  
Khnăng mrng (scalable): Trong quá trình hình thành mng, tìm  
kiếm dliu, thêm và ri nút trong Chord độ phc tp tính toán chỉ  
được tính theo hàm slogarit. Chính điu này to cho Chord khnăng  
mrng vi slượng rt ln các nút, ci thin hiu sut tìm kiếm mt  
cách ti đa.  
Tính sn sàng: Mi nút trong Chord có khnăng tự điu chnh bng  
định tuyến (Finger Table) ca chính nó khi có mt nút tham gia hoc di  
mng. Vic thc hin các chc năng xlý khi thêm nút, ri nút là tự  
động khiến hthng có khnăng tự động cao, chu ít nh hưởng ca các  
yếu tbên ngoài, tăng khnăng ca hthng so vi các hthng khác.  
Mô hình mng Chord  
Mng Chord được cp phát không gian định danh cN, các định danh được  
sp xếp liên tc theo thtnhư trên mt vòng tròn (ring). Mi nút mng có mt  
định danh id, và các id trong mng Chord sp xếp thành vòng tròn và tăng theo  
chiu kim đồng h. Chord sdng mt hàm băm để sinh định danh cho nút và dữ  
liu, đầu ra ca hàm băm là mt giá trN bit.. Mt định danh xác định hai nút kề  
nó bng các hàm Successor(id), và Predecessor(id). Các nút liên kết vi nhau da  
vào Succcessor và Predecessor tương ng vi định danh nó.  
Hình 9 : Mt mng Chord vi 3 nút  
21  
Mi nút slưu mt bng định tuyến gi là Finger Table (Hình 9). Thay vì  
phi tìm kiếm tuyến tính, bng định tuyến cho phép mt nút định tuyến ti các  
nút xa. Mi dòng trong bng Finger Table slưu thông tin v1 nút xa, gi là  
1 liên kết (entry). Entry thi slưu nút là successor ca khóa có định danh cách  
định danh nút đang xét 2i theo chiu tiến ca vòng Chord. Vì vy, không gian  
định danh có bao nhiêu bit thì Finger Table có by nhiêu entry.  
Ánh xkhóa vào mt nút trong Chord  
Chord ánh xcác khóa vào các nút, thường slà mt cp khóa giá tr.  
Mt giá trcó thlà 1 address, 1 văn bn, hoc 1 mc dliu. Chord có ththc  
hin chc năng này bng cách lưu các cp khóa/gía trti các nút mà khóa được  
ánh x(Hình 10). Mt nút schu trách nhim lưu gimt khóa k nếu nút đó là  
nút có định danh id nhnht và ln hơn k. Mt nút khi lưu gikhóa k cũng sẽ  
được gi là Successor(k).  
Hình 10. Lưu gikey trong mng Chord  
Tìm kiếm trong mng Chord  
Khi mt nút cn tìm kiếm mt khóa có định danh id, nút đó stìm nút chu  
trách nhim lưu giid đó. Nếu nút xa so vi vtrí ca nút lưu giid, nút có thể  
nhvào thông tin trong bng Finger Table để định tuyến đến các nút xa hơn, từ  
đó dn dn biết được nút chu trách lưu giid.  
Mt ví dụ được chtrong hình 9, gisnút 3 mun tìm successor ca ID  
(hoc còn có thcoi là khóa) 1. ID 1 thuc khong [7, 3), tc là  
3.finger[3].interval. nút 3 kim tra entry th3 trong bng định tuyến ca nó, là 0.  
Bi vì 0 trước 1, nút 3 shi nút 0 để tìm successor ca 1. Quay trli, nút 0 sẽ  
22  
suy ra tbng định tuyn rng successor ca 1 chính là nút 1, và trvnút 1 cho  
nút 3.  
Tham gia n định mng  
Trong nhng hthng mng động, hot động ca nó thường xuyên gp phi  
nhng sthay đổi vcác nút tham gia mng, có thlà thêm nút mi và có thri  
mng hay hng hóc mt cách đột ngt. Để có thxác định được vtrí ca các  
khóa trong mng, Chord cn được tha mãn 2 yêu cu:  
Mi successor ca 1 nút phi đc duy trì mt cách chính xác  
Vi mi khóa k, nút successor(k) có trách nhim qun lý khóa k  
Khi tham gia vào mt mng Chord, mt nút n cn chn cho nó mt định  
danh id và thông báo cho các nút hàng xóm biết vstham gia ca nó. Các nút  
Successor và Predecessor scn phi cp nht thông tin vnút mi tham gia vào  
mng. Nút n skhi to bng định tuyến Finger Table rng và cp nht dn từ  
các nút khác trong hthng bng vic tìm các nút là Successor ca các id trong  
tng entry ca Finger Table, các id sđược trong quá trình hot động ca hệ  
thng. Để mng vn định tuyến đúng sau khi có stham gia ca nút n, các nút  
cn thường xuyên chy thut toán n định mng để cp nht thông tin vnút  
hàng xóm. Mt snút scó n trong bng Finger Table, nên cn cp nht mt số  
entry ca Finger Table. Cui cùng là nút Successor ca n schuyn mt phn  
khóa mà bây gin là Successor(khóa), cho n lưu gi. Vic chuyn khóa sdo  
tng trên ca ng dng thc hin.  
Khi mt nút chun bri khi mng, nó cn thông báo cho các nút bên cnh  
biết để ổn định li mng. Nút đó cũng schuyn các khóa nó lưu gicho nút  
Successor ca nó. Trong trường hp các nút gp scri đột ngt khi mng, hệ  
thng Chord thông thường smt toàn bdliu được lưu ti nút đó, sau đó các  
nút khác scp nht li bng định tuyến mà không có nút va ri đi.  
2.3. Mt sgii pháp vtìm kiếm tài nguyên trên mng ngang hàng có  
cu trúc.  
Tính hiu quca các hthng mng ngang hàng có cu trúc là không còn phi  
bàn cãi, chính vì vy vic thc hin tìm kiếm tài nguyên mng mt cách hiu quhin  
nay đa số đều được thc hin trên các hthng ngang hàng có cu trúc. Trong phn  
23  
này chúng ta sgii thiu mt snhng hthng tiêu biu, đồng thi cũng là nn tng  
cho ý tưởng chính được đề ra trong khóa lun này.  
2.3.1. Hthng INS/TWINE  
INS/Twine[3] hthng tìm kiếm tài nguyên da trên nn tng chính từ  
INS. Hthng ci tiến so vi INS[2] trong vic phân tng thc hin các công vic  
để đạt hiu qucao hơn, và cho phép thc hin các truy vn theo khong phù hp  
hơn vi các nhu cu tìm kiếm tài nguyên. Trong phn này ta stìm hiu chi tiết  
hơn vhthng này.  
Mô ttài nguyên  
Tài nguyên trong hthng được mô tvi mt như mt hthng thbc  
ca các cp thuc tính – giá tr. Cách tiếp cn là chuyn chúng vdng chính tc  
atributes-value tree(Avtre). Tài nguyên được chú thích bng mô tmeta-data và  
được biu din dưới dng cây  
Hình 11: Ví dvmô ttài nguyên trong INS/TWINE  
Trong INS/Twine, 1 tài nguyên d là kết qutrvcho 1 câu truy vn q nếu  
cây AVTree được thiết lp tq là khp vi AVTree sinh ra bi đặc tca d,  
ngoài ra hthng được htrcho phép tìm kiếm theo truy vn tng phn (partial  
query). Điu này cho phép các truy vn có dng q=<res>camera</res> vn có thể  
tìm kiếm được tài nguyên có mô tnhư hình vẽ  
.
Kiến trúc hthng  
Hthng INS được phân chia làm 3 tng thc hin các công vic riêng bit  
giúp hthng hot động mt cách hiu quhơn.  
24  
Hình 12: Kiến trúc ca hthng INS/TWINE  
Các tng trong hthng:  
Tng phân tích (resolver)  
Tng trên cùng Resolvers ,tương tác vi cây lưu travtree cc  
bvà btruy vn, nm gicác mô ttài nguyên và xlí các truy  
vn.  
Sdng thut toán phân chia các thành phn ca mô t, mc  
đích là để tách mô tra thành các phn có ý nghĩa mà các máy phân  
tích có thể đưa vào mt tp con ca các mô t.  
Hình 13: Ví dvvic chia nhánh tcây avtree  
Hình trên thhin vic trích AVTree thành các nhánh. Snhánh  
được tính theo công thc: s = 2a – t, vi a là scp thuc tính - giá  
tr, t là độ cao ca AVTree.  
25  

Tải về để xem bản đầy đủ

pdf 62 trang yennguyen 01/06/2025 70
Bạn đang xem 30 trang mẫu của tài liệu "Khóa luận Nghiên cứu giải pháp tìm kiếm tài nguyên hiệu quả theo tên miền trên mạng ngang hàng có cấu trúc", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfkhoa_luan_nghien_cuu_giai_phap_tim_kiem_tai_nguyen_hieu_qua.pdf