Khóa luận Xây dựng ứng dụng tìm kiếm thông tin theo vị trí trên mạng ngang hàng có cấu trúc

ĐẠI HC QUC GIA HÀ NI  
TRƯỜNG ĐẠI HC CÔNG NGHỆ  
Phm Đình Hu  
XÂY DNG NG DNG TÌM KIM THÔNG TIN  
THEO VTRÍ TRÊN MNG NGANG HÀNG CÓ  
CU TRÚC  
KHOÁ LUN TT NGHIP ĐẠI HC HCHÍNH QUY  
Ngành: Công nghthông tin  
HÀ NI - 2009  
ĐẠI HC QUC GIA HÀ NI  
TRƯỜNG ĐẠI HC CÔNG NGHỆ  
Phm Đình Hu  
XÂY DNG NG DNG TÌM KIM THÔNG TIN  
THEO VTRÍ TRÊN MNG NGANG HÀNG CÓ  
CU TRÚC  
KHOÁ LUN TT NGHIP ĐẠI HC HCHÍNH QUY  
Ngành: Công nghthông tin  
Cán bhướng dn: TS.Nguyn Hoài Sơn  
HÀ NI - 2009  
LI CM ƠN  
Để hoàn thành khóa lun này, trước hết em xin bày tlòng biết ơn sâu sc ti  
thy TS. Nguyn Hoài Sơn. Thy đã tn tình hướng dn, giúp đỡ em trong sut quá  
trình làm khóa lun. Đồng thi em xin được cm ơn các thy giáo, cô giáo trong  
Trường Đại Hc Công Ngh- Đại Hc Quc Gia Hà Ni đã truyn đạt cho em  
nhiu kiến thc bích trong sut thi gian hc tp ti trường.  
Cui cùng, em xin cm ơn tt cbn bè, gia đình và người thân đã giúp đỡ, động  
viên em rt nhiu để em có thhoàn thành tt khoá lun.  
Hà Ni, ngày 25 tháng 5 năm 2009  
Sinh viên  
Phm Đình Hu  
TÓM TT NI DUNG  
Hin nay, các dch vda vào vtrí cung cp dch vcho các thiết bdi động  
đang phát trin mnh. Trong đó dch vtìm kiếm thông tin theo vtrí là mt dch vụ  
quan trng. Do các máy chcung cp dch vda vào vtrí hin nay hot động ri  
rc, không có sliên kết vi nhau dgây quá ti ti các máy chvào gicao đim,  
thông tin cung cp cho người dùng không đa dng. Chính vì vy ny sinh nhu cu liên  
kết các máy chca các nhà cung cp dch vli vi nhau thành mt mng dch v.  
Để các máy chcung cp dch vcó thliên kết được vi nhau thì phi gii quyết  
được các vn đề vqun lý, lưu tr, xlý thông tin phân tán và tìm kiếm thông tin quy  
mô ln. Mng ngang hàng có cu trúc slà mt gii pháp tt để liên kết các máy chủ  
cung cp dch vli vi nhau vì bn cht ca mng ngang hàng là xlý và lưu trdữ  
liu phân tán đồng thi mng ngang hàng có cu trúc có ưu đim là tìm kiếm dliu  
nhanh, có thtìm kiếm được dliu trên quy mô ln và hthng có khnăng mrng  
cao.  
Khoá lun đã xây dng mt hthng tìm kiếm thông tin theo vtrí da trên mng  
ngang hàng có cu trúc trong đó thông tin tìm kiếm được da trên ngcnh ca người  
sdng. Ngcnh ở đây là các thông tin vtui, gii tính, sthích ca người dùng và  
các thông tin vmôi trường như thi tiết, mùa trong năm, thi gian trong ngày và vtrí  
hin ti ca người dùng. Hthng đã được thnghim và đánh giá thông qua môi  
trường mng có gii hn băng thông và độ trging vi môi trường mng Internet và  
mng đin thoi hin nay. Kết quthnghim cho thy hthng xây dng đã đáp ng  
được các yêu cu ca dch vda vào vtrí là cung cp dch vthi gian thc và có  
thddàng mrng hthng.  
MC LC  
LI MỞ ĐẦU  
CHƯƠNG 1. MÔ HÌNH DCH VDA VÀO VTRÍ  
1
3
1.2. Tng quan vdch vda vào vtrí...............................................................................3  
1.3. Các thành phn ca dch vda vào vtrí .....................................................................4  
1.3.1. Thiết bdi đng .......................................................................................................5  
1.3.2. Mng kết ni............................................................................................................6  
1.3.3. Thành phn định v..................................................................................................8  
1.3.4. Nhà cung cp ng dng và dch v.........................................................................9  
1.4. Cách thc hot đng ca dch vda vào vtrí ...........................................................10  
1.5. Tìm kiếm thông tin da vào vtrí.................................................................................11  
1.6. Tng kết........................................................................................................................12  
CHƯƠNG 2. PHƯƠNG PHÁP TÌM KIM THÔNG TIN TRÊN MNG NGANG HÀNG  
CÓ CU TRÚC  
13  
2.1. Tng quan vmng ngang hàng...................................................................................13  
2.1.1. Khái nim mng ngang hàng.................................................................................13  
2.1.2. Ưu đim và nhược đim ca mng ngang hàng ....................................................14  
2.1.3. Phân loi mng ngang hàng...................................................................................15  
2.2. Mng ngang hàng có cu trúc.......................................................................................16  
2.1.1. Tng quan vmng ngang hàng có cu trúc .........................................................16  
2.2.2. Mng ngang hàng có cu trúc CHORD.................................................................18  
2.3. Tìm kiếm thông tin trên mng ngang hàng có cu trúc................................................22  
2.3.1. Tìm kiếm chính xác...............................................................................................22  
2.3.2. Tìm kiếm theo thuc tính – giá tr.........................................................................22  
2.3.3. Tìm kiếm theo khong...........................................................................................23  
2.4. Kết lun ........................................................................................................................24  
CHƯƠNG 3. XÂY DNG DCH VTÌM KIM THÔNG TIN THEO VTRÍ DA TRÊN  
MNG NGANG HÀNG CÓ CU TRÚC  
26  
3.1. Mc đích và yêu cu ca tìm kiếm thông tin da vào vtrí .........................................26  
3.2. Gii pháp thc hin.......................................................................................................27  
3.2.1. To câu truy vn phù hp vi ngcnh................................................................27  
3.2.2. Biu din dliu theo vtrí...................................................................................27  
3.2.3. Chèn dliu vào mng ngang hàng có cu trúc....................................................29  
3.2.4. Tìm kiếm dliu ...................................................................................................30  
3.3. Cu trúc hthng..........................................................................................................32  
3.4. Hot đng ca hthng................................................................................................33  
3.5. Đặc đim ca hthng đề xut.....................................................................................36  
3.6. Kết lun ........................................................................................................................37  
CHƯƠNG 4. THC THI VÀ ĐÁNH GIÁ CHƯƠNG TRÌNH  
38  
4.1. Kết quthc thi chương trình.......................................................................................38  
4.2. Mô hình thnghim .....................................................................................................39  
CHƯƠNG 5. KT LUN VÀ HƯỚNG PHÁT TRIN TIP THEO  
43  
5.1. Kết lun ........................................................................................................................43  
5.2. Hướng phát trin tiếp theo ca khoá lun.....................................................................44  
DANH MC HÌNH NH  
Hình 1. Cu trúc hthng dch vda vào vtrí .......................................................................4  
Hình 2. Mt sthiết bdi đng sdng dch vda vào vtrí..................................................5  
Hình 3. Mng din rng không dây............................................................................................6  
Hình 4. Mng cc bkhông dây ................................................................................................7  
Hình 5. Mng cá nhân không dây...............................................................................................7  
Hình 6: Xác định vtrí dùng tín hiu vtinh..............................................................................8  
Hình 7. Xác định vtrí dùng da vào các trm sóng đài............................................................9  
Hình 8. Cách thc hot đng ca dch vda vào vtrí ..........................................................10  
Hình 9: Mô hình mng ngang hàng..........................................................................................13  
Hình 10. Hthng mng ngang hàng lai ghép .........................................................................15  
Hình 11. Mng ngang hàng có cu trúc Chord dng vòng tròn ...............................................17  
Hình 12. Mô hình mng Chord.................................................................................................19  
Hình 13: Đnh nghĩa các trường trong bng định tuyến ca Chord .........................................19  
Hình 14. Minh hoquy tc lưu khoá trong mng Chord..........................................................20  
Hình 15. Minh hochia bmt trái đất thành các ô.................................................................28  
Hình 16. Minh homt ô ca bmt trái đất được chia ra ......................................................28  
Hình 17: Minh hotìm kiếm thông tin trong mt vùng ...........................................................30  
Hình 18: Minh hothông tin vtrí ca mt ô trên bmt trái đất............................................31  
Hình 20. Cu trúc hthng dch vtìm kiếm thông tin da vào vtrí.....................................33  
Hình 21: Minh hovic to truy vn theo ngcnh ................................................................34  
Hình 22: Yêu cu địa chIP và cng ca các máy trong mng ngang hàng ............................34  
Hình 23: Yêu cu tìm kiếm ca thiết bdi đng gi lên mng ngang hàng.............................35  
Hình 24: Minh homng ngang hàng trkết qucho thiết bdi đng ....................................36  
Hình 25: Minh hogiao din hin thkết qutìm kiếm thông tin ...........................................38  
Hình 27: Giao din hin thkết qutrên bn đồ.......................................................................39  
Hình 28: Mô hình thí nghim ...................................................................................................39  
Hình 29: Kết quthí nghim ....................................................................................................40  
Hình 30: Đồ thkết quthnghim.........................................................................................41  
LI MỞ ĐẦU  
Ngày này, slượng các thiết bdi động cm tay tăng nhanh, sc mnh xlý và  
bnhca thiết bị đã có thể đáp ng được yêu cu ca nhiu dch v. Trong đó dch  
vda vào vtrí là mt dch vphbiến và đang phát trin hin nay. Dch vnày  
được ng dng trong nhiu lĩnh vc và cung cp các thông tin như dch vgn nht,  
theo dõi phương tin giao thông, các dch vkhn cp. Dch vtìm kiếm thông tin là  
mt dch vquan trng ca dch vda vào vtrí và đang phát trin mnh.  
Tuy hin nay có nhiu dch vtìm kiếm thông tin nhưng thông tin tìm kiếm được  
thường không đúng yêu cu và không có liên hvi ngcnh ca người dùng. Ngữ  
cnh ở đây là các thông tin cá nhân (tui, gii tính, sthích, lch làm vic), thông tin  
môi trường xung quanh (thi gian trong ngày, mùa trong năm, thi tiết...) và vtrí ca  
người dùng. Để đáp ng được nhu cu ca người sdng là tìm kiếm thông tin chính  
xác và phù hp vi yêu cu ca người dùng thì khoá lun đã xây dng mt hthng  
tìm kiếm thông tin theo vtrí trong đó thông tin được tìm kiếm da trên ngcnh ca  
người dùng. Hthng scung cp thông tin mt cách tự động cho người dùng bng  
cách to truy vn tìm kiếm tự động tngcnh ca người dùng. Yêu cu ca hthng  
này là phi có khnăng tìm kiếm dliu trên quy mô ln, có tính phân tán và có khả  
năng mrng cao.  
Công nghmng ngang hàng đã phát trin nhanh chóng trên mng Internet trong  
thi gian gn đây vi sxut hin ca hàng lot các ng ngang hàng như Napster,  
Gnutella, Freenet, BitTorrent, Edonkey…. Sdĩ mô hình mng mng ngang hàng phát  
trin như vy là vì mô hình này rt phù hp vi tính phân tán ca dliu, đồng thi nó  
đảm bo quyn qun lý dliu ca người dùng nên khuyến khích được vic chia sdữ  
liu, làm tăng ngun tài nguyên trên mng. Mô hình mng ngang hàng cũng được sử  
dng để xlý các bài toán phc tp do tn dng được khnăng tính toán phân tán và  
tích hp dliu tcác máy tính tham gia mng. Trong mng ngang hàng các máy  
tham gia đều đóng góp tài nguyên như băng thông, khnăng xlý và khnăng lưu tr.  
Để đáp ng được yêu cu ca hthng tìm kiếm thông tin theo vtrí là có thtìm  
kiếm dliu trên quy mô ln, có tính phân tán và có tính mrng cao thì mng ngang  
hàng có cu trúc là mt gii pháp tt. Bi vì mng ngang hàng có cu trúc có ưu đim  
là có thqun lý, lưu trvà tìm kiếm trên quy mô ln, có tính phân tán và có thdễ  
dàng mrng. Vì vy khoá lun đã đi sâu vào nghiên cu và xây dng hthng tìm  
kiếm thông tin theo vtrí da trên mng ngang hàng có cu trúc . Để đánh giá hiu quả  
ca hthng đã xây dng thì hthng đã được thnghim trong môi trường được gii  
1
hn vbăng thông và độ trging vi môi trường Internet và mng đin thoi hin nay  
và kết quthnghim là khá khquan.  
Khoá lun được chia làm 5 chương:  
- Chương 1: Chương này sgii thiu vcu trúc ca hthng dch vda vào  
vtrí hin đang được sdng và các yêu cu ca dch vda vào vtrí.  
- Chương 2: Trong chương này sgii thiu tng quan vmng ngang hàng, ưu  
nhược đim ca mng ngang hàng và các phương pháp tìm kiếm đang được sdng  
trong mng ngang hàng có cu trúc.  
- Chương 3: Chương này strình bày vý tưởng, yêu cu và cách thc xây dng  
dch vtìm kiếm thông tin theo vtrí da trên mng ngang hàng có cu trúc.  
- Chương 4: Trong chương này chúng ta strình bày vmô hình thc nghim để  
đánh giá hiu quca dch vtìm kiếm thông tin theo vtrí đã xây dng và đưa ra các  
nhn xét đánh giá kết quthnghim.  
- Chương 5: Kết lun và hướng phát trin tiếp theo ca khoá lun.  
2
CHƯƠNG 1. MÔ HÌNH DCH VDA VÀO VTRÍ  
Ngày nay, vi stiến bca khoa hc kthut, đặc bit là sphát trin nhanh  
chóng ca công nghphn cng đã có thto ra các thiết bnhgn, có khnăng lưu  
trvà xlý ln như PDA, Smart Phone, Pocket PC.... Giá thành ca các sn phm này  
liên tc gim khiến cho slượng người dùng sdng các thiết bthông minh này tăng  
nhanh chóng. Chính vì slượng các thiết bthông minh này tăng nhanh dn đến nhu  
cu ca người dùng mun sdng các dch vgia tăng trên các thiết bnày ln. Dch  
vda vào vtrí là mt dch vgia tăng đang phát trin ngày nay. Các ng dng ca  
dch vnày rt đa dng, các ng dng này cung cp cho mi người các thông tin như  
vtrí các rp chiếu bóng, các phòng nghe nhc, các ba tic và các thông tin vbn đồ,  
nhà hàng, vin bo tàng, bnh vin... các địa đim gn mình.  
1.2. Tng quan vdch vda vào vtrí  
Dch vda vào vtrí là dch vcung cp các thông tin liên quan đến vtrí ca  
thiết bdi động cm tay thông qua mng đin thoi hoc kết ni không dây. Dch vụ  
da vào vtrí cũng có thể được định nghĩa là dch vkhai thác các thông tin vvtrí  
ca thiết bdi động cm tay. Dch vnày có thcung cp các thông tin như “Vtrí  
trm ATM (Automatic Teller Machine) gn nht” hoc các thông tin vvtrí ca các  
nhà hàng, quán ăn, các bến xe... quanh vtrí ca thiết bdi động cm tay. Các thông  
tin này có thể được cung cp mt cách tự động mà không cn bt cthao tác yêu cu  
nào ca người dùng hoc người dùng cũng có thyêu cu trc tiếp các thông tin mình  
mun tìm và có thtuchn tìm kiếm thông tin vmt vtrí được chỉ định trên bn đồ  
s. Dch vda vào vtrí mi xut hin gn đây, dch vnày tp trung vào cung cp  
các dch vtrong phm vi nhóm người dùng không chuyên và hot động trong môi  
trường tính toán di động có năng lc tính toán thp.  
Các ng dng phbiến ca dch vda vào vtrí:  
+ Định v: Dùng để xác định vtrí ca mt người nào hay vt nào để trli cho  
câu hi đang ở đâu.  
+ Di chuyn: ng dng này có thchdn mt cách chi tiết làm sao để đi đến  
mt vtrí mà người dùng mong mun.  
+ Tìm kiếm: ng dng này có thlà cung cp các thông tin vcác dch vgn  
nht (có thlà nhà hàng gn nht, trm ATM gn nht), các thông tin vgiao thông  
như tình trng tc nghn giao thông ti đim nào đó.  
3
+ Xác định mt người hay vt: Dùng để xác định mt vt hay người nào đó vị  
trí hin ti.  
+ Kim tra skin: Dùng để kim tra xem có skin nào xy ra vtrí này  
không.  
+ Dch vkhn cp: Khi có các tình trng khn cp như hohon, lũ lt, trm  
cướp thì có thsdng dch vnày để thông báo cho cnh sát hoc cho lính cu ho.  
+ Dch vtheo dõi: Dch vnày có thlà theo dõi giao thông để thông báo cho  
các các xe cu thương hoc cung cp cho người dùng tránh các đim tc nghn.  
1.3. Các thành phn ca dch vda vào vtrí  
Dch vda vào vtrí gm có bn thành phn như hình 1 [3]:  
- Thiết bdi động  
- Mng kết ni  
- Thành phn định vị  
-Nhà cung cp ng dng và dch vụ  
Hình 1. Cu trúc hthng dch vda vào vtrí  
4
1.3.1. Thiết bdi động  
Là các thiết bMobile Phone, Smart Phone, Laptop, PDA... mà người dùng có  
thsdng để truy cp và hin ththông tin. Người dùng có thnhn thông tin dưới  
các dng như âm thanh, văn bn, hình nh... Các thiết bdi động có thlà PDA,  
Phones, Laptops... nhưng cũng có thlà các thiết bị định vgn kèm vi ô tô.  
Có nhiu loi thiết bkết ni vi dch vda vào vtrí, tutheo sc mnh và khả  
năng lưu trca thiết b, người dùng có thsdng mt hoc nhiu dch vkhác  
nhau. Các thiết bdùng dch vda vào vtrí có thể được phân loi thành hai loi là  
thiết bị đơn nhim và thiết bị đa nhim.  
+ Thiết bị đơn nhim: Thường sdng các dch vkhn cp như còi báo động  
hoc cnh báo tình trng khn cp.  
+ Thiết bị đa nhim: Các thiết bnày đang được nhiu người sdng và nó đã  
trthành mt phn ca cuc sng chúng ta. Mt sthiết bị đa nhim trong hình v2:  
Mobile Phone, Smart Phone, Pocket PC, Laptop hoc PDA.  
Hình 2. Mt sthiết bdi động sdng dch vda vào vtrí  
5
+ Đặc đim ca các thiết bdi động:  
- Hu hết các thiết bdi động có tài nguyên tính toán và khnăng xlý thp.  
- Màn hình hin thnh, pin có thi gian sdng ngn, bị ảnh hưởng bi điu  
kin thi tiết.  
- Bgii hn vbăng thông kết ni.  
1.3.2. Mng kết ni  
Thành phn này dùng để truyn dliu, phc vcác yêu cu ca người dùng và  
gi kết qucho người dùng.  
Mng kết ni thường được phân chia thành các loi khác nhau tutheo mc đích,  
gii hn vsóng đài (radio) và các tính cht địa lý.  
+ Mng din rng không dây (WWAN: Wireless Wide Area Networks) thường  
t100 m đến 35 km và yêu cu người dùng phi đăng ký để được sdng. Mng này  
bao gm GSM (Global System for Mobile, GPRS (General Packet Radio Service) và  
UMTS (Universal Mobile Telecommunication System). GMM và GPRS có thtruyn  
dliu ti đa là 14 kbps và 115 kbps ngược li UMTS có thtruyn ti 2 Mbps.  
Hình 3. Mng din rng không dây  
6
+ Mng cc bkhông dây (WLAN: Wireless Local Area Network): khong  
cách t10 đến 150 m. Thiết bdi động có thkết ni thông qua các đim truy cp.  
Hình 4. Mng cc bkhông dây  
+ Mng cá nhân không dây (WPAN: Wireless Personal Area Networks): được  
dùng cho các kết ni trong mt khong ngn xung quanh 10 m và hthng thường  
không yêu cu đăng ký sdng. Thông thường bao gm Bluetooth và các thiết bị  
Infrared (IrDA), dliu truyn qua công nghBluetooth có thlà 1 Mbps trong  
khong cách 10 m và trong trường hp IrDA (Inrared) nó có thlà 16 Mbps trong  
khong 1.5 m.  
Hình 5. Mng cá nhân không dây  
7
1.3.3. Thành phn định vị  
Là thành phn dùng để xác định vtrí hin ti ca người dùng. Hin nay có hai  
phương pháp chính để xác định vtrí người dùng là da vào tín hiu vtinh và da  
vào các trm sóng đài.  
+ Định vda vào vtinh: Mt shthng định vtiêu biu sdng vtinh như  
TACAN – (TACtical Air Navigation), hthng định vtoàn cu (GPS: Global  
Positioning System), GLONASS (Global'naya Navigatsionnaya Sputnikovaya  
Sistema).  
Hình 6: Xác định vtrí dùng tín hiu vtinh  
Các hthng định vsdng vtinh chyếu dùng để phc vcho mc đích  
quân snên khi dùng trong dân sthì chúng bgii hn về độ chính xác như hthng  
định vtoàn cu thì độ chính xác khong 15 m. Hin nay có mt smáy thu tín hiu  
ca hthng định vtoàn cu đã có thxác định vtrí chính xác hơn và sai lch  
khong 3 m.  
Tín hiu ca hthng định vtoàn cu bnhiu bi khá nhiu yếu tnhư: điu  
kin khí quyn, tín hiu đi theo nhiu đường, li đồng bgia máy thu và vtinh ca  
hthng định vtoàn cu, thiết bthu tín hiu bche khut bi các toà nhà.  
8
+ Định vda vào mng: Hthng này xác định vtrí ca người dùng da vào  
các ct sóng đài.  
Hình 7. Xác định vtrí dùng da vào các trm sóng đài  
1.3.4. Nhà cung cp ng dng và dch vụ  
Nhà cung cp dch vcung cp mt scác dch vkhác nhau cho người dùng và  
phn hi các yêu cu cung cp dch vcho người dùng. Các dch vng dng được  
cung cp như các dch vvtìm vtrí, tìm đường đi da trên thông tin mà người dùng  
cung cp hoc tìm kiếm các thông tin về đối tượng mà người dùng quan tâm (như nhà  
hàng, vin bo tàng, khách sn, tim ăn...)  
Thông thường dch vda vào vtrí được chia thành hai loi:  
+ Dch vkéo v(Pull Services): Là nhng dch vụ đáp ng yêu cu trc tiếp  
ca người dùng, dch vnày thường được chia thành hai loi:  
- Dch vchc năng: Các dch vcung cp chc năng htrngười dùng 113,  
115 (gi dch vcp cu khn cp chthông qua mt nút bm).  
- Dch vthông tin: Cung cp thông tin như “tìm quán ăn gn nht”.  
+ Dch vụ đẩy đi (Push Services): Cung cp thông tin dù người có có yêu cu  
hay không yêu cu trc tiếp. Dch vhot động tự động và làm vic khi xy ra mt sự  
kin được chỉ định như dch vdbáo thi tiết, tin nhn qung cáo khi người dùng đi  
vào mt khu vc nào đó.  
9
1.4. Cách thc hot động ca dch vda vào vtrí  
Hthng hot động da trên các thành phn như hình v8 [3]: Các thiết b,  
mng kết ni, công nghxác định vtrí, máy chcung cp dch vvà dliu.  
Hình 8. Cách thc hot động ca dch vda vào vtrí  
Hot động ca hthng snhư sau:  
Bước 1: Đầu tiên các thiết bdi động cm tay sxác định vtrí ca mình da vào  
tín hiu vtinh ca hthng định vtoàn cu, các ct sóng di động hoc da vào các  
đim truy cp không dây.  
Bước 2: Sau khi đã có được thông tin vvtrí hin ti thì thiết bdi động sgi  
thông tin vvtrí ca mình và thông tin cn tìm kiếm (như ca hàng, khách sn, trm  
ATM gn nht) đến máy chcung cp dch vqua mng kết ni.  
Bước 3: Các máy chdch vsẽ đọc yêu cu ca thiết bdi động, xlý yêu cu  
và gi kết qucho thiết bdi động.  
Bước 4: Thiết bdi động shin thkết qucho người dùng, kết qucó thể được  
hin thdưới dng tin nhn hoc hin thtrên bn đồ để người dùng có ththy mt  
cách trc quan vtrí ca thông tin.  
10  
1.5. Tìm kiếm thông tin da vào vtrí  
+ Yêu cu ca hthng tìm kiếm thông tin theo vtrí là:  
- Cung cp kết quchính xác vi yêu cu ca người dùng và giá thành ca dch  
vhp lý.  
- Có thể định vị được các thiết bdi động trong phm vrng,  
- Vi các dch vkhác nhau thì có độ ưu tiên khác nhau như vi dch vkhn  
cp thì phi đáp ng nhanh còn vi dch vtìm tim ăn, nhà hàng, khách sn thì có thể  
ưu tiên ít hơn.  
- Dch vkhông làm tăng kích thước, khi lượng ca thiết bnhiu cũng như  
không làm tiêu tn nhiu năng lượng ca thiết b.  
- Có thphc vụ được mt slượng ln các thiết bdi động ti cùng mt thi  
đim.  
- Các thông tin vkhách hàng phi được gibí mt.  
- Hthng phi ddàng mrng: Có thtăng sngười sdng cũng như tăng  
khnăng xlý và lưu trca hthng.  
- Hthng có thcung cp dch vthi gian thc.  
- Người dùng có thsdng dch vmi lúc, mi nơi.  
+ Vn đề tìm kiếm thông tin theo vtrí:  
Hthng dch vtìm kiếm thông tin theo vtrí hin nay chyếu được xây dng  
theo mô hình khách - ch. Nhược đim ca mô hình này đó là dbquá ti ti máy chủ  
trung tâm khi có nhiu người dùng truy cp cùng mt thi đim và khó khăn khi mở  
rng hthng.  
Yêu cu ca hthng dch vtìm kiếm thông tin theo vtrí là hthng có thlưu  
tr, xlý, tìm kiếm dliu trên quy mô ln và có khnăng mrng cao vì vy vic  
trin khai dch vnày trên mô hình khách - chlà không phù hp. Mng ngang hàng  
có cu trúc là mt gii pháp tt để trin khai dch vtìm kiếm thông tin theo vtrí vì  
bn cht ca mng ngang hàng là qun lý, lưu tr, xlý thông tin phân tán và mng  
ngang hàng có cu trúc có ưu đim là có ththtìm kiếm thông tin nhanh, tìm kiếm  
trên quy mô ln và hthng có tính mrng cao.  
11  
1.6. Tng kết  
Chương này đã gii thiu tng quan vdch vda vào vtrí, cu trúc ca dch  
vda vào vtrí, hot động ca dch vda vào vtrí cũng như các yêu cu hthng  
ca dch vnày.  
Qua các yêu cu ca dch vnày ta có ththy vic trin khai dch vda vào vị  
trí trên mng ngang hàng là hoàn toàn khthi vì khi trin khai dch vnày trên mng  
ngang hàng thì hthng scó thtn dng được khnăng lưu tr, xlý thông tin ca  
các máy tham gia vào mng chính vì vy làm tăng khnăng xlý tng thca hệ  
thng. Khnăng xlý tng thca hthng tăng slàm cho thi gian đáp ng ca  
dch vnhanh, đáp ng được dch vthi gian thc và ưu đim ca mng ngang hàng  
là khnăng mrng dcao chính vì vy hthng trin khai trên mng ngang hàng sẽ  
được ưu đim là khnăng mrng hthng ddàng.  
12  
CHƯƠNG 2. PHƯƠNG PHÁP TÌM KIM THÔNG TIN TRÊN MNG  
NGANG HÀNG CÓ CU TRÚC  
Mng ngang hàng ngày càng trnên phbiến trong các ng dng chia strên  
mng. Các mng ngang hàng đã xut hin tnhng năm 1980 và phát trin mnh mẽ  
như APANET, Usenet, FidoNet. Hin nay, vi stham gia ca các công ty thương  
mi và phi thương mi như Napster, Gnutella mng ngang hàng ngày càng ln mnh  
được được nhiu người sdng. Nht là hin nay khi lượng thông tin truyn ti trên  
mng vô cùng ln, nhu cu tìm kiếm và chia sthông tin cũng tăng lên. Mng ngang  
hàng được xây dng gia các máy tính độc lp có khnăng chia sdliu và tn dng  
tài nguyên để chia scho các máy tính khác.  
2.1. Tng quan vmng ngang hàng  
2.1.1. Khái nim mng ngang hàng  
Mng ngang hàng là mt cu trúc được to nên bi các máy tính liên kết vi  
nhau, vai trò ca mi máy tính là như nhau, mi máy tính là mt phn và duy trì stn  
ti ca mng. Các máy tính trong mng thường xuyên liên lc vi các máy tính khác  
để ổn định mng và chia sdliu vi nhau. Mng ngang hàng có nhiu ng dng và  
ng dng phbiến nht là chia stp tin, tt ccác dng tp tin chia snhư âm thanh,  
hình nh, dliu...  
Hình 9: Mô hình mng ngang hàng  
13  
Mt mng ngang hàng đúng nghĩa không có khái nim máy chmáy khách  
hay nói cách khác tt ccác máy tham gia đều bình đẳng và được gi là Peer. Peer là  
mt nút mng va đóng vai trò là máy chvi các máy khác trong mng va đóng vai  
trò là máy khách khi được các máy khác phc vmình. Dliu được cha trên các  
máy tính và chia strc tiếp vi nhau cũng thông qua các máy tính tham gia vào mng  
ngang hàng.  
2.1.2. Ưu đim và nhược đim ca mng ngang hàng  
Mô hình mng ngang hàng rt phù hp vi tính phi tp trung ca Internet, bi  
bn cht ca tài nguyên là phân tán, các thông tin lưu trkhông chtrên các máy chủ  
ccác máy khách.  
Xét vkhía cnh sc mnh xlý, mng mng ngang hàng có khnăng xlý cao  
hơn cnhng máy chln nht hin nay do đó sdng mng mng ngang hàng có thể  
ci thin đáng khiu quca các phương pháp phân tích, xlý dliu và gii các bài  
toán phc tp (đây đều là nhng vn đề vượt ra ngoài tm xlý ca nhng máy chủ  
tp trung khi slượng truy vn, tính toán tăng lên đến hàng trăm triu mi ngày). Sdĩ  
như vy là vì mng ngang hàng đã tn dng khnăng xlý, khnăng lưu trcòn tha  
ca các máy tính tham gia mng vi nhng thut toán phân tán hp lý. Công nghnày  
đã chia vic xlý ln ra thành nhng vic xlý nhcó thphân tán gia các máy tính  
trong mt mng. Mi máy tính sxlý mt phn dliu và trvkết quxlý cho  
máy tính trung tâm, máy tính trung tâm sghép ni các kết qunày li vi nhau. Bng  
cách đó, ta có thgii quyết được nhng bài toán phc tp mà không cn phi nâng  
cp khnăng xlý ca hthng hin ti.  
Bên cnh đó, vic phân tán trách nhim cung cp dch vụ đến tt ccác nút trên  
mng sgiúp loi bvn đề ngng trdch vdo nơi cung cp duy nht gp sc.  
Mng ngang hàng cũng tn dng được băng thông trên toàn bmng vì vic tăng  
sgiao tiếp gia các thiết bmng qua các đường truyn khác nhau slàm gim khả  
năng tc nghn mng. Ngoài ra, khi càng nhiu máy tính tham gia vào mng ngang  
hàng thì tng sc mnh xlý, khnăng lưu trvà băng thông li tăng theo điu đó cho  
thy khnăng mrng ca mng mng ngang hàng.  
Tuy nhiên, mng ngang hàng cũng có nhiu nhược đim. Vi mô hình mng  
ngang hàng thun túy, tc là mô hình mà ở đó mi máy đều có vai trò như nhau và  
không tuân theo bt cmt quy lut định tuyến hay kết ni nào thì mng mng ngang  
hàng cũng bc lkhá nhiu nhược đim:  
14  
+ Chính vì yêu cu dch vụ được đáp ng mt cách tùy biến nên máy yêu cu  
dch vcó thnhn được nhiu kết qukhác nhau khi nó kết ni đến các máy khác  
nhau cung cp cùng mt dch v.  
+ Các yêu cu gi đi có thkhông nhn được kết qutrvvì không có gì đảm  
bo stn ti mt máy nào đó có khnăng đáp ng yêu cu đó.  
+ Các tài nguyên có thbiến mt do nút cung cp tài nguyên có thngt kết ni  
bt clúc nào.  
2.1.3. Phân loi mng ngang hàng  
Mng ngang hàng lai ghép  
Trong mô hình này, mi máy đều được ni vi tt ccác máy khác trong mng,  
cách ni này mang đặc đim ca mô hình mng ngang hàng thun túy. Tuy nhiên, vn  
có mt máy đóng vai trò máy chtrung tâm, máy chnày có nhim vqun lý các  
thông tin chmc.  
Hình 10. Hthng mng ngang hàng lai ghép  
Nhng nhược đim ca vic qun lý điu khin tp trung vn tn ti trong mô  
hình mng này. Nếu máy chtrung tâm gp li thì các máy Peer không thtruy cp  
15  
đến thông tin chmc trên máy chtrung tâm nên không thtìm kiếm thông tin  
được. Đại din cho mô hình mng ngang hàng lai ghép là mng ngang hàng Napster.  
Mng ngang hàng thun tuý  
Trong mng ngang hàng thun tuý thì vai trò ca các máy trong mng là ngang  
nhau và trong mô hình mng này thì đã loi bstn ti ca các máy chtp trung.  
Mng ngang hàng thun tuý được chia thành hai loi là mng ngang hàng không có  
cu trúc và mng ngang hàng có cu trúc.  
Mng ngang hàng không cu trúc: Trong mng ngang hàng không cu trúc thì  
các liên kết gia các nút trong mng được thiết lp ngu nhiên không theo quy lut.  
Nhng mng như thế này ddàng được xây dng vì mt máy mi khi mun tham gia  
mng có thly các liên kết có sn ca mt máy khác đang trong mng và sau đó  
dn dn tbn thân nó sthêm vào các liên kết mi cho riêng mình. Khi mt máy  
mun tìm mt dliu trong mng ngang hàng không cu trúc, yêu cu tìm kiếm sẽ  
được truyn trên cmng để tìm ra càng nhiu máy chia scàng tt. Đại din cho mô  
hình mng này là mng ngang hàng Gnutella.  
2.2. Mng ngang hàng có cu trúc  
2.1.1. Tng quan vmng ngang hàng có cu trúc  
Nhược đim ca mng ngang hàng không có cu trúc là không thể đảm bo chc  
chn stìm thy mt thông tin có tn ti trên mng ngang hàng do mng này sdng  
cơ chế tìm kiếm phát tràn tc là gi thông đip ra toàn mng. Thông đip tìm kiếm  
theo kiu phát tràn chỉ được chuyn tiếp mt sln ri sbloi bnên không thể đảm  
bo stìm thy thông tin có tn ti trên mng. Cách tìm kiếm phát tràn khi tìm kiếm  
các dliu phbiến được chia strên nhiu máy thì tlthành công là khá cao nhưng  
ngược li nếu dliu chỉ được chia strên mt vài máy thì xác sut tìm thy là nh.  
Tính cht này là hin nhiên vì trong mng ngang hàng không có cu trúc, không có bt  
kmi liên hgia mt máy và dliu nó qun lý trong mng, do đó yêu cu tìm  
kiếm được chuyn mt cách ngu nhiên đến mt smáy trong mng. Slượng máy  
trong mng càng ln thì khnăng tìm thy thông tin càng nh. Mt nhược đim khác  
ca hthng này là yêu cu gi đi không có định hướng nên mt yêu cu tìm kiếm  
thường được chuyn cho mt slượng ln các máy trong mng, làm tiêu tn mt  
lượng ln băng thông ca mng và dn đến hiu qutìm kiếm chung ca mng thp.  
Mng ngang hàng có cu trúc đã khc phc nhược đim ca mng không cu trúc  
bng cách sdng hthng bng băm phân tán (DHT: Distributed Hash Table [6]).  
16  
Hthng này định nghĩa liên kết gia các nút mng trong mng theo mt thut toán cụ  
th, đồng thi xác định cht chmi nút mng schu trách nhim đối vi mt phn  
dliu chia strong mng. Vi cu trúc này, khi mt máy cn tìm mt dliu, nó chỉ  
cn áp dng mt giao thc chung để xác định nút mng nào chu trách nhim cho dữ  
liu đó và sau đó liên lc trc tiếp đến nút mng đó để ly kết qu.  
Trong mng ngang hàng có cu trúc, tài nguyên được phân bmt cách hp lý  
để không có mt máy tính nào lưu giquá nhiu dliu dn đến quá ti thông tin định  
tuyến. Do mng là có cu trúc nên các thông đip chuyn đi gia các máy tính để duy  
trì mng ngang hàng được gim xung ti thiu. Băng thông ca mng được dành  
nhiu hơn cho vic chia stài nguyên.  
Hình 11. Mng ngang hàng có cu trúc Chord dng vòng tròn  
Vic tìm kiếm thông tin trong mng ngang hàng có cu trúc cũng nhanh hơn  
trong mng ngang hàng không có cu trúc. Nếu như trong mng ngang hàng không có  
cu trúc các máy tính gi thông đip lan tràn để tìm kiếm thông tin thì trong mng  
ngang hàng có cu trúc mt máy tính chcn gi thông đip tìm kiếm qua mt smáy  
tính là có thtìm thy được thông tin có tn ti trên mng.  
Mt smng ngang hàng có cu trúc ni tiếng bao gm Chord, CAN, Kademlia,  
Pastry Tapestry.  
17  
DHT nhn mnh vào các thuc tính sau:  
+ Khnăng mrng: hthng vn có thhot động hiu quvi hàng nghìn  
hoc hàng triu nút.  
+ Khnăng chu li: hthng vn có thlàm vic n định ngay ckhi có các sự  
kin nút tham gia, ri bmng hay li xy ra.  
+ Kthut khóa được sdng để đạt được mc đích là mi nút chcn liên kết  
vi mt sít các nút khác trong hthng, thường là O(logn) vi n là snút tham gia.  
Vì vy sthay đổi ca mt nút chỉ ảnh hưởng đến mt phn nhca hthng mng.  
+ Mt sthiết kế bng băm phân tán có tính bo mt nhm chng li nhng  
người tham gia có ác tâm và cho phép người tham gia giu danh tính, mc dù điu này  
không phbiến trong các hthng mng ngang hàng chia stp tin.  
+ Cui cùng, bng băm phân tán phi gii quyết nhng vn đề cơ bn ca các hệ  
thng phân tán đó là cân bng ti, tính toàn vn dliu và hiu năng (cthđảm  
bo các hot động như định tuyến, lưu tr, truy vn phi được thc thi nhanh chóng).  
2.2.2. Mng ngang hàng có cu trúc CHORD  
Theo mt đánh giá tng hp vcác thut toán định tuyến da trên bng băm  
phân tán trong các kiến trúc mng khác nhau như hình tròn (vi giao thc Chord), hình  
cây, hình hp (vi giao thc CAN)…xét vtính linh hot trong vic định tuyến, khả  
năng phc hi trng thái cũng như khnăng chu li, kiến trúc hình tròn đều được  
đánh giá cao. Vì vy, kiến trúc Chord thường được sdng như là mng phủ để thc  
hin các cài đặt ci tiến vic tìm kiếm trên mng ngang hàng có cu trúc.  
Mô hình mng Chord:  
Chord được mô tdưới dng mt vòng tròn và không gian định danh phân bố  
đều trên vòng tròn tăng dn theo chiu kim đồng h. Nếu gi N là sbit định danh ca  
không gian khóa thì mng Chord có thế cha ti đa 2N nút. Mi nút trên Chord có mt  
định danh id và có khnăng duy trì liên kết hai chiu vi các nút đứng lin trước và  
lin sau nó theo chiu kim đồng h, to thành mt mch liên kết vòng. Nút lin trước  
được gi là Successor(id), và nút lin sau được gi là Predecessor(id). Thêm vào đó,  
mi nút slưu mt bng định tuyến gi là Finger Table, cho phép nút đó định tuyến ti  
các nút xa. Mi dòng trong bng Finger Table slưu thông tin vmt nút xa, gi  
là mt entry. Không gian định danh ca mng sdng bao nhiêu bit thì Finger Table  
có by nhiêu entry.  
18  
Hình 12. Mô hình mng Chord  
Hình trên minh hocho mt mng Chord có 3 nút là 0, 1, 3 và các bng Finger  
Table ng vi mi nút, N = 3 bit nên Finger Table có 3 entry. Các trường trong mi  
entry trong bng Finger Table ca nút n được định nghĩa trong bng dưới:  
Hình 13: Định nghĩa các trường trong bng định tuyến ca Chord  
Trong đó các giá trti dòng i ca bng được coi như là finger thi ca nút n.  
Thông tin lưu trong bng cũng bao gm cIP và Port ca các nút tương ng. Nút đầu  
19  
tiên trong bng Finger Table ca n chính là Successor ca n, hay còn được gi là  
Immediate Successor.  
Tbng Finger Table trên ta có ththy rng:  
+ Mi nút chcn lưu trthông tin ca mt snút nht định trong bng định  
tuyến ca mình.  
+ Nút biết thông tin vcác nút gn nó nhiu hơn là các nút xa.  
+ Bng cách định tuyến thông qua bng Finger Table, mt nút n có thxác định  
được vtrí ca bt kkhóa nào trên mng.  
Ánh xkhóa vào mt nút trong Chord  
Chord ánh xcác khóa vào các nút, thường theo cp (khoá, giá tr). Mt giá trcó  
thlà mt địa ch, mt văn bn, hoc mt mc dliu. Chord có ththc hin chc  
năng này bng cách lưu các cp (khoá, giá tr) các nút mà khoá được ánh x. Mt nút  
schu trách nhim lưu gimt khóa k nếu nút đó là nút có định danh id nhnht tha  
mãn điu kin id >= k. Mt nút khi lưu gikhóa k cũng sẽ được gi là Successor ca  
k, ký hiu là Successor(k).  
Hình dưới minh hovic lưu khoá trong mng Chord: nút 0 lưu khoá 6, nút 1 lưu  
khoá 1 và nút 3 lưu khoá 2.  
Hình 14. Minh hoquy tc lưu khoá trong mng Chord  
20  
Tìm kiếm trong mng Chord  
Khi mt nút n cn tìm kiếm mt khóa có định danh id, nút n stìm nút chu trách  
nhim lưu giid đó. Nếu nút n xa so vi vtrí ca nút lưu giid, n có thnhvào  
thông tin trong bng Finger Table để định tuyến đến các nút xa hơn, từ đó dn dn tìm  
ra nút chu trách nhim lưu giid.  
Mt ví dụ được chra trong hình 12, gisnút 3 mun tìm successor ca ID = 1  
(hoc còn có thcoi là khóa) . ID =1 thuc khong [7, 3). Nút 3 kim tra entry th3  
trong bng định tuyến ca nó, là 0. Bi vì 0 nm ngay trước 1 trên vòng tròn, nút 3 sẽ  
hi nút 0 để tìm successor ca 1. Tiếp theo, nút 0 stìm trong bng định tuyến ca nó  
và suy ra successor ca 1 chính là nút 1, và trli nút 3 rng nút 1 chính là successor  
ca khóa ID = 1.  
Tham gia và n định mng  
Trong mt mng động thì các nút thường xuyên tham gia hay ri mng nên để có  
thxác định được vtrí ca các khóa lưu trong mng Chord thì mng này cn tha  
mãn các đim sau.  
+ Mi successor ca mt nút phi được duy trì.  
+ Vi mi khóa k, nút successor(k) có trách nhim qun lý k.  
Khi tham gia vào mt mng Chord, mt nút n cn chn cho nó mt định danh id  
và báo cho các nút bên cnh biết stham gia ca nó. Các nút Successor và Predecessor  
scn phi cp nht thông tin vnút mi tham gia vào mng và nút n cũng skhi to  
bng định tuyến cho riêng mình. Để mng vn định tuyến đúng sau khi có stham gia  
ca nút n thì các nút cn thường xuyên chy thut toán n định mng để cp nht  
thông tin vcác nút bên cnh (hay nút láng ging). Mt snút có lưu thông tin vn  
trong bng Finger Table thì cn cp nht các entry liên quan trng Finger Table. Cui  
cùng, nút Successor ca n schuyn mt phn khóa k mà bây gin là Successor(k)  
cho n lưu gi.  
Khi mt nút chun bri khi mng, nó cn thông báo cho các nút bên cnh biết  
để ổn định li mng. Nút đó cũng schuyn các khóa nó lưu gicho nút Successor ca  
mình.  
21  
2.3. Tìm kiếm thông tin trên mng ngang hàng có cu trúc  
2.3.1. Tìm kiếm chính xác  
Là phương pháp tìm kiếm thông tin theo định danh, định danh này có thlà băm  
tmt tkhoá do người dùng nhp vào, ttên tp tin hoc tmt phn ni dung ca  
tp tin.  
Phương pháp này chcó thcho phép tìm kiếm chính xác thông tin người dùng  
yêu cu mà không thtìm kiếm mt thông tin có kết qugn ging vi yêu cu ca  
người dùng. Ví dnhư khi người dùng mun tìm mt quyn sách “Mng ngang hàng  
có cu trúc” nhưng người dùng chnhp vào tkhoá “Mng ngang hàng” thì thông tin  
tìm thy chlà nhng thông tin có ni dung là “Mng ngang hàng” mà không thtìm  
thy các thông tin như “Mng ngang hàng không có cu trúc, Mng ngang hàng có cu  
trúc, mng ngang hàng lai ghép...”. Phương pháp tìm kiếm này thường dùng kết hp  
vi bng băm phân tán. Khi được kết hp vi bng băm phân tán thì phương pháp tìm  
kiếm này có ưu đim là gim sthông báo yêu cu tìm kiếm và các thông báo gi đi  
định hướng.  
Hin nay, có rt nhiu mng ngang hàng có cu trúc đang sdng phương pháp  
tìm kiếm này, tiêu biu là các mng ngang hàng có cu trúc CAN, Chord, Pastry.  
2.3.2. Tìm kiếm theo thuc tính – giá trị  
Phương pháp tìm kiếm này ssdng các cp thuc tính – giá trị để tìm kiếm  
thông tin. Các tkhoá mà người dùng hay sdng chyếu là các cp thuc tính – giá  
trví dnhư “Trường = Đại Hc Công Ngh” là mt cp thuc tính – giá tr, thuc  
tính là “Trường” và giá trlà “Đại Hc Công Ngh”. Theo thng kê thì mt tkhoá  
tìm kiếm mà người dùng sdng trung bình gm có 2.53 tvà có ti 71.5% các truy  
vn tìm kiếm bao gm hai hoc nhiu hơn các tkhoá . Do tkhoá tìm kiếm thường là  
cp thuc tính – giá trnên tìm kiếm theo phương pháp này có thtìm được hu hết  
các thông tin mà người dùng mong mun.  
Trong phương pháp này ni dung thông tin sẽ được biu din thành mt tp các  
cp thuc tính – giá tr. Vic tìm kiếm thông tin cũng sda trên các cp cp thuc  
tính – giá tr, trong yêu cu tìm kiếm scó cha mt tp các cp thuc tính – giá trị  
cn truy vn. Kết qutrvscha danh sách các bn ghi có các cp thuc tính – giá  
trthomãn truy vn.  
22  
Vic phân bthông tin có thda vào mt trong scác cp thuc tính để phân bổ  
hoc vi mt thông tin có n cp thuc tính – giá trcó thsphi phân bthông tin  
này ra n nút để khi tìm kiếm có thtìm được thông tin đã phân bnày.  
Mt sgii thut tìm kiếm theo giá tr- thuc tính tiêu biu như: CDS [4]  
(Content discovery System), INS/Twine [5]  
2.3.3. Tìm kiếm theo khong  
Là phương pháp tìm kiếm mà giá trca mt thuc tính dao động trong mt  
khong nào đó. Ví dnhư tìm kiếm mt thuc tính “Qun Áo” có giá trt“100.000  
đến 300.000 đồng” hoc tìm kiếm trong mt vùng địa lý, mt khong thi gian.  
Người dùng khi tìm kiếm thông tin thường không biết chính xác thông tin hoc  
chbiết mt phn thông tin hoc mun tìm thông tin trong mt gii hn nào đó. Để có  
thcung cp thông tin cho người dùng dù người dùng chbiết mt phn thông tin hoc  
mun tìm thông tin trong mt gii hn thì phương pháp tìm kiếm theo khong được sử  
dng.  
Tìm kiếm theo khong trên các hthng tp trung rt đơn gin chcn duyt tt  
ccác bn ghi theo chmc để ly ra các bn ghi thomãn thuc tính có giá trtheo  
khong yêu cu. Tuy nhiên để tìm kiếm theo khong trên mng ngang hàng có cu trúc  
là khó vì mng ngang hàng có cu trúc chhtrtìm kiếm chính xác. Tc là chcó  
nhng thông tin như “Giá = 100.000 đồng” thì mi có thtìm được trên mng ngang  
hàng có cu trúc mà không thtìm được các thông tin như “Giá < 100.000 đồng và  
Giá > 10.000 đồng”.  
Để có thtìm kiếm theo khong trên mng ngang hàng có cu trúc thì chúng ta  
có mt sý tưởng để thc hin vic đó:  
- Ý tưởng để có thtìm kiếm theo khong trên mng ngang hàng có cu trúc đó  
là dùng mt phép biến đổi ttìm kiếm theo khong thành tìm kiếm chính xác. Phép  
chuyn đổi này có thể được thc hin bng cách biu din thông tin sao cho dliu  
trong mt khong nào đó được chuyn thành dliu ti mt đim hoc vi nhng dữ  
liu gn ging nhau thì được chèn vào mng ngang hàng ti các vtrí gn nhau vmt  
tô pô ca mng (như các dliu gn ging nhau có thlưu hai nút là hàng xóm ca  
nhau).  
- Ta có thcoi mt khong là mt giá trnào đó khi chèn thông tin vào mng  
ngang hàng có cu trúc như “Bt kgiá cca mt hàng nào có giá t100.000 đồng  
đến 200.000 đồng” thì ta coi như là nó có giá tr100.000 đồng. Sau đó băm chui “Giá  
23  
= 100.000 đồng” để ly định danh và chèn vào mng ngang hàng có cu trúc, trong  
bn ghi được chèn thì vn có cha thông tin vgiá cthc ca mt hàng. Khi tìm kiếm  
mt mt hàng tkhong 120.000 đến 180.000 đồng thì ta chvic băm chui “Giá =  
100.000 đồng” để ly định danh và tìm xem nút nào qun lý định danh này. Khi đã biết  
được nút nào qun lý định danh này thì ta struy vn đến đó và tìm kiếm, nút cha  
định danh khi nhn yêu cu tìm kiếm sduyt trong cơ sdliu (lúc này vic tìm  
kiếm là cc bnên có thddàng lc thông tin theo khong) để tìm các bn ghi thoả  
mãn và trvcho máy yêu cu.  
Nếu dliu gn tường đồng nhau mà được chèn mt vùng gn nhau vmt tô pô  
ca mng ngang hàng có cu trúc thì các truy vn tìm kiếm theo khong có thtruy  
vn quanh vùng đó để ly được thông tin cn tìm.  
2.4. Kết lun  
Trong chương này chúng ta đã gii thiu tng quan vmng ngang hàng, các ưu  
nhược đim ca mng ngang hàng và phân loi mng ngang hàng.  
Mang ngang hàng được chia thành hai loi là mng ngang hàng lai ghép và mng  
ngang hàng thun tuý.  
Đại din cho mô hình mng ngang hàng lai ghép là mng ngang hàng Napster,  
đặc đim ca mô hình mng này là có mt máy chtrung tâm qun lý chmc và đây  
cũng chính là nhược đim ca mô hình này. Khi máy chtrung tâm bli thì mng  
ngang hàng lai ghép skhông thtìm kiếm được thông tin do không thtruy cp đến  
thông tin chmc do máy chqun lý.  
Mng ngang hàng thun tuý được chia thành hai loi là mng ngang hàng có cu  
trúc và mng ngang hàng không có cu trúc. Mng ngang hàng Gnutella là đại din  
cho mng ngang hàng không có cu trúc và nhược đim ca mô hình mng này là  
không đảm bo chc chn tìm kiếm được dliu có tn ti trên mng do sdng cơ  
chế tìm kiếm phát tràn thông đip. Do mng ngang hàng không có cu trúc sdng cơ  
chế tìm kiếm phát tràn nên làm tn băng thông mng đồng thi gim hiu qutìm  
kiếm.  
Mng ngang hàng có cu trúc đã khc phc được nhng nhược đim ca mng  
ngang hàng không có cu trúc. Các nút trong mng ngang hàng có cu trúc được liên  
kết vi nhau theo mt quy lut, mi nút squn lý mt phn dliu chia strên mng  
và các dliu chia snày scó mi liên hvi nút qun lý. trong mô hình mng  
24  

Tải về để xem bản đầy đủ

pdf 51 trang yennguyen 10/05/2025 80
Bạn đang xem 30 trang mẫu của tài liệu "Khóa luận Xây dựng ứng dụng tìm kiếm thông tin theo vị trí trên mạng ngang hàng có cấu trúc", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfkhoa_luan_xay_dung_ung_dung_tim_kiem_thong_tin_theo_vi_tri_t.pdf