Khóa luận Tìm kiếm ngẫu nhiên trên các mạng ngang hàng phi cấu trúc

ĐẠI HC QUC GIA HÀ NI  
TRƯỜNG ĐẠI HC CÔNG NGHỆ  
Đào Văn Toán  
TÌM KIM NGU NHIÊN TRÊN CÁC MNG  
NGANG HÀNG PHI CU TRÚC  
KHOÁ LU  
N T  
T NGHI  
P
ĐẠI HC HCHÍNH QUY  
Ngành: Công ngh thông tin  
HÀ NI - 2010  
ĐẠI HC QUC GIA HÀ NI  
TRƯỜNG ĐẠI HC CÔNG NGHỆ  
Đào Văn Toán  
TÌM KIM NGU NHIÊN TRÊN CÁC MNG  
NGANG HÀNG PHI CU TRÚC  
KHOÁ LU  
N T  
T NGHI  
P
ĐẠI H  
C H CHÍNH QUY  
Ngành: Công ngh thông tin  
Cán b  
h
ướng d  
n: TS. Nguy  
n
Đại Th  
HÀ NI - 2010  
LI CM ƠN  
Để có thhoàn thành được khóa lun có kết qunhư ngày hôm nay, ngoài snỗ  
lc ca chính bn thân, tôi còn nhn được sgiúp đỡ tNhà trường, thy cô, gia đình và  
bn bè, đó là điu may mn đối vi tôi, và cũng là nim hnh phúc.  
Đầu tiên, em chân thành cm ơn ging viên, tiến sĩ Nguyn Đại Th, người đã  
hướng dn trc tiếp cho em làm khóa lun này. Thy đã giành cho em nhiu thi gian để  
tho lun vvn đề nghiên cu, nhit tình htrem trong vic nhìn nhn, đánh giá vn  
đề gp phi và phát trin ý tưởng. Htrem trong vic kim nghim, mô phng chương  
trình để có kết quả đánh giá và góp ý kiến cho em thc hin khóa lun này.  
Em xin cm ơn trường Đại hc Công Ngh- ĐHQG Hà Ni đã to điu kin cho  
em tham gia hc tp, rèn luyn và sinh hot trong môi trường tt, hin đại. Đặc bit là to  
điu kin cho em tham gia thc hin khóa lun, cho em cơ hi phát huy vn kiến thc, kỹ  
năng đã tiếp thu được, cũng như phát huy khnăng nhìn nhn vn đề khoa hc-công  
ngh-cuc sng trong lĩnh vc hc tp ca mình sau khóa hc.  
Và li cm ơn sâu sc tôi mun giành cho gia đình tôi, đặc bit là bmtôi, nhng  
người vt vngày đêm lao động để lo cho tôi có thhoàn thành tt khóa hc, luôn động  
viên tôi hc tp cho tt, to điu kin cho tôi vmt vt cht trong quá trình theo hc ti  
trường.  
Cui cùng, tôi xin gi li cm ơn ti nhng người bn ca tôi, cm ơn các bn đã  
giúp đỡ tôi khi tôi gp khó khăn trong hc tp, cũng như trong cuc sng. Đặc bit để  
hoàn thành khóa lun này, các bn còn giành thi gian để tho lun cùng tôi, giúp tôi thu  
thp kết qumô phng.  
Hà Ni, tháng 5 năm 2010.  
Đào Văn Toán  
TÓM TT NI DUNG  
Trong các mô hình client-server, mô hình mng ngang hàng tp trung hay mô hình  
mng ngang hàng lai ghép, nếu mt người dùng trong mng sdng máy tính để tìm  
kiếm tài nguyên thì vic tìm kiếm là đơn gin bi shtrca server hoc siêu đim nút.  
Tuy nhiên, vi mô hình mng ngang hàng thun túy vic tìm kiếm li không đơn gin, đó  
là bi vì đim nút tìm kiếm không có thông tin vtrí tài nguyên, không có thông tin định  
tuyến, cũng như thông tin vcác đim nút khác trong mng, trcác đim hàng xóm vi  
nó. Chính bi nhng đặc trưng này, đã có nhiu bài báo, công trình nghiên cu trước đây  
đề xut ra gii pháp ci tiến phương pháp tìm kiếm đơn lhay đề xut phương pháp tìm  
kiếm kết hp như là: phương pháp tìm kiếm động [20], phương pháp tìm kiếm lai  
[14],…Ngoài ra còn có nhng đề xut để ci tiến hiu sut tìm kiếm ca các phương pháp  
tìm kiếm đơn lnhư trong các tài liu [16], [17], [23].  
Tuy nhiên chưa có bài báo nào đề cp đến vic kết hp 2 phương pháp tìm đơn lẻ  
theo trình t: phương pháp di chuyn ngu nhiên trước và phương pháp phát tràn sau.  
Khóa lun ca chúng tôi đề xut phương pháp tìm kiếm lai ghép mi tý tưởng này, sau  
đó thc hin mô phng các phương pháp trên mt sdng đồ thchung ca mng ngang  
hàng thun túy. Chúng tôi cũng đưa ra các phân tích, đánh giá vcác phương pháp tìm  
kiếm.  
Phương pháp ca chúng tôi cho kết qutt trên đồ thlut hàm mũ trong mt số  
trường hp, còn vi tô pô phân cm thì cho kết qukém hơn nhưng tt hơn so vi  
phương pháp phát tràn trên đồ thnày.  
MC LC  
Bng ký hiu viết tt.............................................................................................................1  
MỞ ĐẦU ..............................................................................................................................1  
CHƯƠNG 1. TNG QUAN VMNG NGANG HÀNG ................................................6  
1.1. Thành phn cu to mng ngang hàng....................................................................6  
1.1.1. Khái nim đim nút..........................................................................................6  
1.1.2. Cách phân loi peer trong mng ngang hàng...................................................7  
1.2. Mng ngang hàng....................................................................................................8  
1.2.1. Định nghĩa mng ngang hàng ..........................................................................8  
1.2.2. Phân loi các mô hình mng ngang hàng.......................................................11  
1.3. Mng xếp chng....................................................................................................18  
CHƯƠNG 2. LÝ THUYT ĐỒ THVÀ CÁC DNG ĐỒ THMNG.........................19  
2.1. Khái nim đồ th....................................................................................................19  
2.1.1. Đồ thhướng..............................................................................................19  
2.1.2. Đồ thvô hướng .............................................................................................19  
2.1.3. Các khái nim khác ........................................................................................20  
2.2. Các dng đồ thtrong mng ngang hàng ..............................................................20  
2.2.1. Đồ thngu nhiên...........................................................................................21  
2.2.2. Đồ thlut hàm mũ.........................................................................................21  
2.2.3. Tô pô phân cm..............................................................................................22  
CHƯƠNG 3. CÁC PHƯƠNG PHÁP TÌM KIM ĐÃ ĐỀ XUT TRƯỚC ĐÂY...........24  
3.1. Các phương pháp tìm kiếm đơn l........................................................................24  
3.1.1. Phương pháp tìm kiếm phát tràn thông thường .............................................24  
3.1.2. Phương pháp tìm kiếm di chuyn ngu nhiên................................................25  
3.2. Các phương pháp tìm kiếm kết hp......................................................................26  
3.2.1. Phương pháp tìm kiếm động ..........................................................................27  
3.2.2. Phương pháp tìm kiếm lai ..............................................................................27  
CHƯƠNG 4. CÁC PHƯƠNG PHÁP TÌM KIM LAI GHÉP CA CHÚNG TÔI .........30  
4.1. Phương pháp tìm kiếm lai ghép sdng phát tràn thông thường.........................30  
4.1.1. Phương pháp tìm kiếm lai ghép biến ththnht .........................................30  
4.1.2. Phương pháp tìm kiếm lai ghép biến ththhai ...........................................34  
4.2. Phương pháp tìm kiếm lai ghép sdng phát tràn ci tiến ..................................37  
4.2.1. Phương pháp tìm kiếm lai ghép biến ththba ............................................38  
4.2.2. Phương pháp tìm kiếm lai ghép biến ththtư.............................................41  
CHƯƠNG 5. MÔ PHNG VÀ ĐÁNH GIÁ HIU NĂNG..............................................46  
5.1. Các đơn vị đo hiu năng trong mô phng.............................................................46  
5.1.1. Mc độ bao ph..............................................................................................46  
5.1.2. Tlthành công.............................................................................................47  
5.1.3. Slượng truy vn thành công ........................................................................47  
5.1.4. Hiu qutruy vn...........................................................................................48  
5.1.5. Slượng nút nhn truy vn dư tha...............................................................48  
5.2. Kết qumô phng trên đồ thlut hàm mũ ..........................................................49  
5.2.1. Đồ thlut hàm mũ vi 55 thông báo truy vn...............................................49  
5.2.2. Đồ thlut hàm mũ vi N thông báo truy vn ...............................................51  
5.3. Kết qumô phng trên tô pô phân cm................................................................53  
5.3.1. Mô phng trên tô pô phân cm vi 55 thông báo truy vn ............................53  
5.3.2. Mô phng trên tô pô phân cm vi N thông báo truy vn.............................55  
5.4. Đánh giá vphân bthông báo truy vn...........................................................61  
CHƯƠNG 6. KT LUN VÀ ĐỊNH HƯỚNG ................................................................65  
TÀI LIU THAM KHO..................................................................................................67  
Bng ký hiu viết tt  
ARPANET  
BFS  
Advanced Research Projects Agency Network  
Breadth-First Search  
Centrol Processing Unit  
Depth-First Search  
CPU  
DFS  
GUID  
FTP  
General Unique ID  
File Transfer Protocol  
Telecommunication Network  
Time-to-Live  
Telnet  
TTL  
MỞ ĐẦU  
Thế hmng Internet đầu tiên có tên là mng ARPANET, mng này được phát trin  
tdán ca Bquc phòng Mvào nhng năm cui ca thp niên 1960. Mc đích ca  
mng ARPANET là dùng để chia scác tài nguyên tính toán và các tài liu gia các trung  
tâm nghiên cu khác nhau trên nước M. Mô hình đầu tiên ca mng chcó 4 máy, nhng  
máy này được đặt ti các địa đim khác nhau là: Trường Đại hc California, trung tâm  
nghiên cu phát trin ca Hc vin nghiên cu Stanford, trường Đại hc California ti  
Santa Barbara và Đại hc Utah. Các máy trong mng ARPANET đầu tiên không có đặc  
trưng gì ging như client hay server, chúng được xem là ngang hàng nhau vì vy mng  
này còn được gi là mng ngang hàng đầu tiên.  
Các ng dng đầu tiên và vượt tri trên mng Internet là: FTP và Telnet..vv..nhưng  
bn thân chúng li là các ng dng client-server, sau khi mng Internet xut hin thì các  
ng dng phát trin cho mng chyếu là ng dng cho mô hình mng client-server. Ngày  
nay, các ng dng mng ngang hàng cũng trnên phbiến hơn và ngày càng đa dng như  
là: BitTorrent, Skype, FlashGet, Gnutella, Sopcast, Napster…vv. Strli và phát trin  
ca các ng dng mng ngang hàng là vì stn ti ca mô hình mng client-server có  
nhiu hn chế. Điu đó có ththy rõ ràng, server không thlưu tt ccác thông tin mà  
client yêu cu được bi vì vn đề lưu trcó hn và khi slượng client tăng đến mc độ  
nào đó thì nhu cu vti, băng thông tăng lên dn đến vic các server không có khnăng  
cung cp dch vcho các client tham gia vào, chi phí để mrng mng là tn kém. Tuy  
nhiên, vi mô hình mng ngang hàng có thgii quyết được nhng vn đề này, ngoài ra  
còn tn dng được sc mnh tp thca các máy tham gia trong vic tính toán, ddàng  
mrng và chi phí thp.  
Mng ngang hàng có nhiu tiêu chí để phân loi nhưng phân loi mt cách tương  
đối da trên đặc đim cu trúc ca mng thì phân chia thành 2 loi : loi có cu trúc, và  
loi không có cu trúc. Nhng mng ngang hàng không có cu trúc còn được phân chia  
tiếp thành 3 loi: mng ngang hàng tp trung, mng ngang hàng thun túy, mng ngang  
hàng lai. Trong khóa lun ca chúng tôi, chúng tôi tp trung vào các mô hình mng ngang  
hàng thun túy.  
Hin ti, để tìm kiếm thông tin hay tài nguyên trên Internet, hu hết người sdng  
thường thông qua các trình duyt để truy cp ti các server cung cp dch vtìm kiếm  
1
như Google, Bing..vv..sau đó người sdng sgi yêu cu tìm kiếm ca mình lên đó.  
Khi tìm kiếm vi Google, người dùng snhn được hàng nghìn kết qu, có cnhng kết  
quchng liên quan gì đến thông tin mà người dùng cn, thm chí có cnhng kết quả đã  
quá cũ và không còn tn ti, hay cnhng kết qukhông có giá tr. Điu này làm cho  
người dùng có quá nhiu thông tin la chn không cn thiết và dgây ln ln. khó chu.  
Tuy vic tìm kiếm cho kết qunhanh nhưng nhng máy tìm kiếm này vn còn nhiu  
nhược đim khác như là: vn đề yêu cu nhiu phn cng để htrlưu trthông tin và tài  
nguyên bsung, vn đề khi máy chtìm kiếm đột nhiên tm ngưng hot động, vn đề khi  
mà kích thước mng tăng lên trong khi slượng máy htrcho dch vtìm kiếm là có  
hn, vn đề các tài nguyên chỉ được phép lưu hành trong ni b..vv.. Nhưng mt dch vụ  
tìm kiếm tương tđược cài đặt trên mng ngang hàng thì có thgii quyết được các  
vn đề vi kết qutìm kiếm trv, ngoài ra còn có nhiu li thế khác như là: hn chế kết  
qukhông cn thiết, không lo hin tượng máy chbngưng hot động, không lo vn đề  
kích thước mng tăng…vv.., thông tin có ththam kho thêm trong tài liu [3].  
Các ng dng chia stài nguyên phbiến ca mng ngang hàng vào thi đim hin  
ti như là: BitTorrent, Napster,…vv. các ng dng này thuc mô hình mng ngang hàng  
tp trung và mng ngang hàng lai. Vic tìm kiếm tài nguyên vi các mô hình này là đơn  
gin và vic tìm kiếm ging như tìm kiếm trong mô hình client-server bi vì được htrợ  
bi máy chtìm kiếm trung tâm hay siêu đim nút (SuperPeer hay SuperNode) do đó tìm  
kiếm không phi là vn đề đối vi các mô hình mng ngang hàng này. Nhưng mô hình  
mng ngang hàng thun túy không tn ti máy chtìm kiếm trung tâm hay các siêu đim  
nút để lưu trthông tin vcác tài nguyên được các đim nút khác trong mng chia s. Do  
đó mng ngang hàng thun túy là mt mô hình mng đặc bit và vic tìm kiếm là vn đề  
quan trng vi mng này.  
Nếu mt công ty hay tchc xây dng mô hình mng theo kiu mô hình mng  
ngang hàng thun túy thì cn thiết có mt ng dng để htrnhng người dùng máy  
trong hthng mng có thtìm kiếm các tài nguyên chia strong tchc, công ty. Các  
tài nguyên chia snày có thlà: âm nhc, phim, nh, tác phm văn hc, không gian lưu  
tr, thiết bị đắt tin hay thông tin du lch, thông tin hi hp..vv.. ca các thành viên trong  
công ty, tchc chia s.  
Để đáp ng vic tìm kiếm tài nguyên trên mô hình mng này có mt sphương  
pháp được đã đề xut như là phương pháp phát tràn (hay lan ta) và bước dch chuyn  
2
ngu nhiên, nhng phương pháp này chúng tôi gi là nhóm phương pháp đơn lphbiến.  
Ngoài ra có mt vài công trình nghiên cu đề xut vtìm kiếm trước đây, các công trình  
này đề xut các phương pháp tìm kiếm kết hp 2 phương pháp đơn l, đó là: phương pháp  
tìm kiếm động [19], phương pháp tìm kiếm lai [5], phương pháp tìm kiếm lai [14], …vv.  
Phương pháp lai trong tài liu [14] thc hin như sau: phát tràn trước, ri sau đó thc hin  
di chuyn ngu nhiên trên các nút phát tràn tìm được. Tt ccác phương pháp kết hp  
được đề xut trước đây là có skết hp ca cphương pháp phát tràn và phương pháp di  
chuyn ngu nhiên nhưng đều được xây dng theo tiêu chí phm vi tìm kiếm, tùy theo  
phm vi và cách thc mà có skết hp tha mãn.  
Đối vi mô hình mng thun túy do đặc trưng cu trúc ca mng và bi vì vic lưu  
trtài nguyên là ngu nhiên, bt ktrên các nút trong mng khi đó các phương pháp tìm  
kiếm được sdng da trên phm vi chmang tính ước lượng và rt khó để chn la giá  
trchính xác phm vi là bao nhiêu cho hp lý. Nói chung vic tìm kiếm các tài nguyên  
trong mô hình mng thun túy vn là tìm kiếm ngu nhiên bi các thông tin tìm kiếm  
không được biết trước. Cách thc tìm kiếm có thlà sdng phương pháp tìm kiếm mù  
đơn thun hoc là có skết hp ca nhiu phương pháp tìm kiếm mù.  
Gistrong trường hp chúng ta phát tràn toàn bphm vi có thca phát tràn  
nhưng chưa có tài nguyên cn tìm, sau đó li phi mt vài ln di chuyn ngu nhiên mi  
thy, nếu như làm ngược li thì scó hiu quthế nào, như vy đây cũng là mt trong  
nhng trường hp cn xem xét. Vic thc hin thtngược li scó trình ttìm kiếm là:  
thc hin di chuyn ngu nhiên schng bng vi lượng phát tràn trên, sau đó thc hin  
phát tràn vài bước tiếp theo thì skhông làm tăng ti cho các nút khác và không gây tn  
băng thông chung toàn mng. Dĩ nhiên githiết chung cho các phương pháp tìm kiếm vn  
là không thbiết vtrí nào có tài nguyên, không có thông tin định tuyến ti các nút khác  
trong mng trnút hàng xóm.  
Đồng thi trong các phương thc đề xut trước đây chưa có phương thc nào sử  
dng cho phương pháp di chuyn ngu nhiên trước, ri sau đó sdng phương pháp phát  
tràn. Vì vy chúng tôi đề xut xây dng phương pháp tìm kiếm lai ghép ca mình da  
trên ý tưởng đó, không chỉ đề xut phương pháp tìm kiếm chúng tôi còn phân tích, đánh  
giá cùng vi các phương pháp tìm kiếm khác da trên các tiêu chí đánh giá để có ththy  
được phương pháp tìm kiếm nào cho hiu qutt, phương pháp nào không hiu qu.  
3
Kết qusau mô phng cho thy phương pháp tìm kiếm lai ghép biến ththba và  
thnht ca chúng tôi cũng cho kết qutt không kém gì phương pháp phát tràn trên đồ  
thlut hàm mũ vi lượng thông báo 55, sinh ra slượng nút trùng lp thông báo là thp  
hơn. Còn vi lượng thông báo truy vn N (N là srt ln) thì phương pháp lai ghép biến  
ththba và phương pháp lai đề xut trong [14] và phương pháp lai ghép biến ththtư  
cho kết qutt, tuy nhiên các phương pháp li cho kết quslượng nút btrùng lp thông  
báo truy vn cao.  
Trên tô pô phân cm thì phương pháp di chuyn ngu nhiên vn là tt nht đối vi  
lượng thông báo truy vn nhvà ln, phương pháp lai trong tài liu [14] cũng là phương  
pháp tt, còn các phương pháp đề xut ca chúng tôi cho giá trtt hơn phương pháp tràn  
nhưng vn là phương pháp ti. Nhưng snút nhn thông báo truy vn dư tha trong  
phương pháp ca chúng tôi là ít hơn. Ngoài ra chúng tôi còn đánh giá mu 2 phương pháp  
vmc độ phân bti, đánh giá để nhìn nhn tng quan vkết quca các phương pháp.  
Phn tiếp theo ca khóa lun được tchc như sau:  
Chương 1: Tng quan vmng ngang hàng. Trong chương này, chúng tôi gii thiu  
mt cách tng quan các kiến thc liên quan đến mng ngang hàng như là khái nim về  
đim nút (peer), khái nim mng ngang hàng, các mô hình mng ngang hàng hin ti.  
Chương 2: Lý thuyết đồ thvà các dng đồ thmng. Ni dung chúng tôi trình bày ở  
trong chương này, tóm lược lý thuyết đồ thnhư : khái nim đồ th, khái nim bc ca mt  
đỉnh trong đồ th, các dng đồ th. Và tp trung vào các dng đồ thmng phc vcho mô  
phng ca chúng tôi như : đồ thngu nhiên, đồ thlut hàm mũ, tô pô phân cm.  
Chương 3: Các phương pháp tìm kiếm đã đề xut trước đây. Trong chương này,  
chúng tôi trình bày các phương pháp tìm kiếm đã được đề xut: Các phương pháp đơn l:  
phương pháp phát tràn, phương pháp di chuyn ngu nhiên. Các phương pháp kết hp ca  
2 phương pháp đơn l: phương pháp tìm kiếm động, phương pháp lai ghép.  
Chương 4: Các phương pháp tìm kiếm lai ca chúng tôi. Nhng đề xut, hướng gii  
quyết trong vic kết hp 2 phương pháp đơn ltheo cách ca chúng tôi, theo vn đề  
chúng tôi đặt ra, được trình bày chi tiết trong chương này.  
Chương 5: Mô phng và đánh giá hiu năng. Trong chương này, chúng tôi gii thiu  
mt vài độ đo để làm cơ sở đánh giá mt phương pháp tìm kiếm tt hay không tt so vi  
4
phương pháp khác. Đó là : mc độ bao ph, slượng nút nhn truy vn dư tha, tlệ  
thành công, các truy vn thành công, và hiu qutruy vn.  
Kết quca các mô phng cũng được trình bày trong chương này. Và các nhn xét,  
đánh giá vgiá trca các phương pháp tìm kiếm đã đạt được.  
Chương 6: Kết lun và định hướng. Tnhng kết quthu được, chương 6, trong  
chương này chúng tôi đi đến kết lun, đánh giá về đề xut ca chúng tôi so vi nhng đề  
xut đã nêu, tìm ra ưu đim, nhược đim ca phương pháp và từ đó đề xut hướng phát  
trin mi, cũng như công vic dự định tiến hành trong tương lai.  
Như vy trong phn này, chúng tôi gii thiu tng quan vkhóa lun ca chúng tôi,  
cũng như trình tni dung vn đề chúng tôi strình bày.  
5
CHƯƠNG 1. TNG QUAN VMNG NGANG HÀNG  
Hin nay, tên gi “ mng ngang hàng ” hay “ mng đồng đẳng ” và các ng dng  
ca kiu mng này như là: Napster, Skype, BitTorrent, FlashGet, Sopcast, ICQ...vv..  
không còn xa lgì vi người dùng Internet, đặc bit là nhng người dùng có nhu cu về  
tìm kiếm tài nguyên, chia stài nguyên như: phn mm, phim nh, âm nhc, file văn bn.  
Mng máy tính gia đình cũng là mng ngang hàng khi người dùng cu hình máy tính theo  
nhóm (WorkGroup), cho phép các máy trong nhóm có thchia sfile, máy in và các tài  
nguyên, thiết bkhác. Như vy, sphbiến ca mng ngang hàng là rt rng nhưng hiu  
biết vmng ngang hàng, cũng như mng ngang hàng bao gm nhng thành phn gì? Thế  
nào được gi là mng ngang hàng? Cu trúc ra sao? Hot động ra sao? Có bao nhiêu loi  
mô hình mng được gi là mng ngang hàng?..vv..thì đa phn người dùng chưa có cái  
nhìn tng quan và chi tiết vchúng. Trong chương này, chúng tôi strình bày vnhng  
vn đề đó, không chỉ để hiu rõ vmng ngang hàng mà còn có giúp cho vic tìm hiu  
các vn đề liên quan đến ni dung tiếp theo ca chúng tôi.  
Đầu tiên, chúng tôi strình bày vcác thành phn trong mng ngang hàng và khái  
nim mng ngang hàng. Sau đó, chúng tôi sgii thiu vcác loi mô hình mng ngang  
hàng, trong đó chúng tôi stp trung trình bày chi tiết mô hình mng ngang hàng liên  
quan đến vn đề khóa lun ca chúng tôi, đó là mng ngang hàng thun túy. Mt mô hình  
mng ngang hàng đặc bit.  
1.1. Thành phn cu to mng ngang hàng  
Trong các mô hình mng cu trúc kiu client-server thì thông thường, cu trúc ca  
mô hình này bao gm 2 thành phn chính là: client (máy khách) và server (máy ch). Tuy  
nhiên trong mô hình mng cu trúc kiu mng ngang hàng thì thành phn li là các đim  
nút .  
1.1.1. Khái ni  
m
đim nút  
Đim nút tên tiếng Anh là “peer”. Mt đim nút là mt thành phn trong mng  
ngang hàng. Nếu đánh giá vmt trc quan thì có ththy đim nút thường được hiu là  
mt máy tính, thiết bdi động, máy in, hay thiết bhtrcá nhân..vv..Tuy nhiên, không  
thể định nghĩa đim nút là mt thiết bnhư thế vì skhông thhin được đúng khái nim  
về đim nút. Nếu nhìn nhn đim nút như là mt ng dng đang chy trên mt máy tính  
6
đơn và máy tính này được kết ni vào mt mng như mng Internet, định nghĩa như thế  
này cũng không thhin được chc năng và tt cnhng thhin có thca đim nút  
được. Như vy, nếu nhìn nhn phiến din về đim nút thì đã làm gim khnăng ca mt  
đim nút và chthy nó ging như mt thiết bcó thể đáp ng các đim nút khác đang  
chy trong mng.  
Trong tài liu [3] đã phát biu đầy đủ về đim nút như sau:  
“Mt thc thnào đó có khnăng thc hin chc năng có ích nào đó và truyn đạt  
các kết quca chc năng đó ti các thc thkhác trên mt mng, mt cách trc tiếp  
hoc gian tiếp, được gi là mt đim nút”.  
Như vy, từ định nghĩa ta có ththy mt đim nút nó là mt thành phn thiết bnào  
đó trong mng, có thlà máy tính cá nhân, có thlà thiết bhtrcá nhân, hay thiết bdi  
động, router, modem, máy in…vv. Khi các thành phn này tham gia vào mng thì mi  
thành phn schy các ng dng nào đó để thc hin chc năng ca mình như: hoc chia  
stài nguyên file, chia stài nguyên không gian lưu tr, chia stài nguyên phn cng,  
chia stiến trình nhàn ri, cung cp ni dung…vv.hoc htrợ định tuyến hoc nhn chia  
stcác thiết bkhác trong mng hoc tìm kiếm tài nguyên…vv.  
Trong mt stài liu thì khái nim đim nút còn được hiu là nút hoc nt .  
1.1.2. Cách phân loi peer trong mng ngang hàng  
Theo định nghĩa trên “chc năng có ích” là phthuc vào tng loi đim nút,  
công vic mà đim nút đó đảm nhim. Do đó có thphân làm 3 loi đim nút khác nhau  
như trong tài liu [3] đã phân chia:  
- Đim nút thông thường : Tên tiếng Anh là “Simple Peer”, là mt đim nút bình  
thường trong mng ngang hàng, nó được thiết kế cho người dùng cui. Mt đim nút  
thông thường scung cp dch vcho các đim nút khác và cũng nhn scung cp tcác  
đim nút khác trong mng. Tuy nhiên, trong thc tế mt đim nút thông thường snm  
trong mt mng riêng bit, hoc là đằng sau mt tường la nên các đim nút khác nm  
phía bên ngoài skhó có thgiao tiếp trc tiếp vi đim nút thông thường nm đằng sau  
tường la.  
- Đim nút gp g: Tên tiếng Anh là “Rendezvous Peer”, cũng là mt loi đim nút,  
tuy nhiên nó nm phía ngoài các mng riêng bit, nhim vca nó là cung cp các thông  
tin để tìm kiếm các đim nút khác và các tài nguyên ca đim nút khác cho các đim nút  
thông thường gi yêu cu tìm kiếm.  
7
- Đim nút định tuyến: Tên tiếng Anh là “Router Peer”, là đim nút cung cp các cơ  
chế để chuyn thông tin giao tiếp gia các đim nút khác vi nhau, cho phép các thông tin  
này vượt qua các tưởng la hoc các thiết bchuyn đổi địa chmng.  
Nhóm đim nút là: mt nhóm các đim nút có cùng mt mc đích hay dch v,  
thường gi là Peer Group. Các đim nút trong mt nhóm schia sthông tin cho các đim  
nút khác trong nhóm và các đim nút ngoài nhóm không thtiếp cn được.  
Phn trình bày trên, đã nêu rõ khái nim về đim nút, nhóm đim nút, cũng như cách  
phân loi đim nút. Ngoài cách phân loi như trong tài liu [3] thì phân loi đim nút như  
trong các tài liu khoa hc, kthut khác li có skhác bit, chng hn như trong tài liu  
[2], [12] phân chia thành 2 loi đim nút là: đim nút thông thường và siêu đim nút.  
- Đim nút thông thường : là mt đim nút bình thường, mt thành phn trong mng,  
tham gia vào mng, khi tham gia vào mng thì các đim nút loi này chia stài nguyên  
hoc nhn chia stcác đim nút khác trong mng.  
- Siêu đim nút: Tên tiếng Anh là “Super Peer” hoc “Super Node”, là mt đim nút  
trong mng, chúng có vai trò qun lý đim nút trong vùng (qun lý vcác peer, thông tin  
tài nguyên mà các peer chia s, thông tin định tuyến…vv..), định tuyến cho các đim nút  
trong mng sang đim nút vùng khác. Nói chung có đầy đủ tính năng ca ba loi đim  
nút đã mô tả ở trên, tc là nó không lưu trtài nguyên mà chcung cp, qun lý thông tin  
vtài nguyên, qun lý các đim nút trong vùng ca nó, định tuyến cho các đim nút sang  
vùng khác nếu cn thiết và giúp các đim nút trong vùng trao đổi vi các đim nút vùng  
khác.  
1.2. Mng ngang hàng  
1.2.1. Định nghĩa mng ngang hàng  
Trong tài liu tham kho [2], Oram đã định nghĩa vmng ngang hàng như sau:  
“Mng ngang hàng là 1 lp ng dng tn dng ưu đim ca lưu trcác tài nguyên,  
các chu trình, ni dung, giá trhin din ca con người phía rìa ca mng Internet. Bi  
vì vic truy cp ti các tài nguyên phi tp trung này ging như đang hot động trong mt  
môi trường kết ni không n định và các địa chIP không thể đoán trước được, các nút  
mng ngang hàng phi hot động bên ngoài hthng DNS và có quyn ttrị đáng kể  
hoc hoàn toàn độc lp vi các máy chtrung tâm”.  
8
Theo định nghĩa này, mng ngang hàng là mt hthng phân tán đặc bit trong tng  
ng dng, ở đó mi cp đim nút có thgiao tiếp vi nhau thông qua giao thc định tuyến  
trng các tng mng ngang hàng. Mi đim nút gi1 đối tượng dliu nào đó có thlà  
nhc, nh, tài liu,..vv... Mi đim nút có thtruy vn ti đối tượng nó cn tcác đim  
nút khác thông qua kết ni logic trong tng mng ngang hàng.  
Sau này, Oram và các đồng nghip đã đưa ra định nghĩa cơ bn và hoàn chnh hơn:  
[a Peer-to-Peer system is] a self-organizing system of equal, autonomous entities  
(peers) [which] aims for the shared usage of distributed resources in a networked envi-  
ronment avoiding central services.” [12].  
Tài nguyên  
Server  
Client  
Client  
Request  
Response  
Client  
Client  
Hình 1.Mô hình mng client-server  
Trong mô hình mng client-server như ở Hình 1 bao gm: máy client và máy server,  
có nhiu máy client truy cp ti máy server để tìm kiếm tài nguyên. Nhưng trong mng  
ngang hàng không có khái nim máy trm (client) hay máy ch(server) mà chcó khái  
nim các nút (peer) đóng vai trò như cclient và server. Hay còn được gi là “Servent”  
được ghép tServer” và “Client”.  
9
Peer  
Peer  
Peer  
Peer  
Peer  
Peer  
Peer  
Peer  
Hình 2. Mô hình mng ngang hàng  
Các định nghĩa vmng ngang hàng trên là định nghĩa tru tượng và tng quát  
cho mng ngang hàng nói chung. Còn đối vi mng máy tính ngang hàng thì định nghĩa  
theo tài liu[12] như sau:  
Mt mng ngang hàng bao gm các phn tmáy tính:  
(1)  
(2)  
(3)  
được kết ni bi 1 mng máy tính,  
địa chcó thtrong 1 phm vi duy nht, và  
chia s1 giao thc truyn thông chung.  
Tt ccác thành phn máy tính đồng nghĩa vi các nút hay các đim nút, có vai trò  
tương đương nhau và có trách nhim chia sđược dùng các tài nguyên.  
Do đó đối vi các mng máy tính ngang hàng, khi xem xét mt đim nút ta có thể  
hiu đó là máy tính. Tuy nhiên trong phm vi ca khóa lun này, chúng tôi không đề cp  
đến vn đề vcác giao thc chia s, giao thc truyn thông gia các đim mút, cũng như  
cách thc hot động ca tng đim nút mà chnêu định nghĩa tng quát vmng ngang  
hàng máy tính, thông tin chi tiết ca vn đề có ththam kho trong tài liu [2], [3], [12].  
10  
1.2.2. Phân loi các mô hình mng ngang hàng  
Vic phân loi mng ngang hàng có nhiu cách phân loi, trong khóa lun này,  
chúng tôi phân loi da theo phân chia trong tài liu [12], đó là da theo đặc đim cu  
trúc ca mng ngang hàng.  
Cthvcách phân loi mng ngang hàng có ththam kho trong Hình 3 dưới đây.  
Trong Hình 3 thì mng ngang hàng phi cu trúc được chia làm 3 mô hình mng ngang  
hàng khác. Tuy nhiên trong phm vi nghiên cu ca khóa lun, chúng tôi tp trung vào  
mô hình mng phi cu trúc, phi tp trung, hay còn gi là mô hình mng ngang hàng thun  
túy. Mt mô hình mng ngang hàng đặc bit. Để tìm hiu đầy đủ vcác loi mô hình  
mng ngang hàng, có ththam kho thêm trong tài liu [12].  
M
ng ngang hàng  
M
ng ngang hàng  
M
ng ngang hàng có  
u trúc  
phi c u trúc  
cấ  
Thế  
h
m
th  
ng ngang hàng  
nh  
Th  
ế
h
m
th hai  
ng ngang hàng  
t
M
ng ngang hàng t  
trung  
p
M
ng ngang hàng  
M
ng ngang hàng  
lai  
thu n túy  
Hình 3. Phân loi mng ngang hàng.  
11  
1.2.2.1. Mng ngang hàng tp trung  
Mng ngang hàng tp trung là mt trong nhng thế hmng ngang hàng đầu tiên,  
đặc trưng ca mng này vn da vào mt máy chtìm kiếm trung tâm. Tô pô xếp chng  
ca mt mng ngang hàng tp trung do đó có thể đưc miêu tnhư mt mng hình sao.  
Trong mô hình mng này, mi đim nút kết ni ti máy chtìm kiếm trung tâm để  
có thgi truy vn tìm kiếm tài nguyên, sau khi gi yêu cu ti máy chtìm kiếm trung  
tâm, máy chtìm kiếm trung tâm trvthông tin phn hi tương ng vi tkhóa được  
quy định trong truy vn. Tc là ti máy chtìm kiếm trung tâm, tkhóa trong thông báo  
truy vn sẽ được ánh xvi bng danh sách tài nguyên mà máy chcó. Nếu máy chtìm  
kiếm trung tâm có thông tin mà đim nút đó yêu cu thì nó strvthông tin vtrí truy  
cp ti các đim nút chia s(đa phn là trvcác địa chIP và các cng). Sau khi đim  
nút đã nhn được thông tin tmáy chtìm kiếm trung tâm thì lúc này quá trình trao đổi  
thông tin cn tìm được thc hin theo đúng cơ chế ca mng ngang hàng, tc là trao đổi  
trc tiếp gia các nút mng vi nhau mà không cn qua máy chtìm kiếm trung tâm.  
Như vy, trong mô hình này bao gm :  
Mt máy chtìm kiếm trung tâm, máy chnày cha danh sách thông tin vcác  
đim nút trong mng do nó qun lý (bao gm : địa chIP, cng, băng thông kết  
ni..vv.) và danh sách thông tin vcác tài nguyên (tên tài nguyên, dung lượng tài  
nguyên, kiu tài nguyên…vv.) mà mi đim nút trong mng chia s.  
Các đim nút, các đim nút này lưu trcác tài nguyên cn chia svi các đim nút  
khác trong mng.  
Cơ chế hot động ca mô hình này bao gm 2 hot động : hot động gia các đim  
nút vi máy chtìm kiếm trung tâm, hot động gia các đim nút vi nhau.  
Hot động gia đim nút máy chtìm kiếm trung tâm:  
- Tìm kiếm tài nguyên  
- Đăng nhp vào mng xếp chng  
- Để đăng ký  
- Cp nht thông tin các bng định tuyến  
- Cp nht thông tin tài nguyên được chia sẻ  
12  
Hot động gia đim nút ↔ đim nút:  
- Trao đổi dliu.  
ng dng đin hình cho mô hình mng kiu này là: Napster. ng dng Napster hỗ  
trvic chia sfile và nhc (min phí) gia nhng người dùng mng Internet và được  
xem như đim bt đầu ca mng ngang hàng. Do các vn đề lut pháp vbn quyn và  
shu trí tuệ đối vi các tác phm âm nhc nên Napster đã thay đổi dch vca nó thành  
mt dch vchia sfile hp pháp trên Internet.  
Vi Napster, vic tìm kiếm mt file có thbtht bi nếu như bng tìm kiếm ti máy  
chtìm kiếm trung tâm không có thông tin cn tìm kiếm hay thông tin cn tìm kiếm là  
không có giá trị được chia s. Trong mô hình mng kiu này, chcó tiến trình tìm kiếm  
file đã lưu trtrong mt mng và vn đề lưu trlà phân tán.  
Để biết thông tin vtài nguyên các đim nút phi gi truy vn tìm kiếm ti máy ch,  
nếu như slượng ln các đim nút trong mng đồng thi gi truy vn tìm kiếm ti máy  
chthì khi đó máy chủ đóng vai trò là mt nút cchai và đim duy nht chu li. Để tránh  
tình trng đó thì sc mnh tính toán và khnăng lưu trca máy chtìm kiếm tp trung  
phi tăng lên tương xng vi slượng đim nút trong mng. Vì vn đề là “tương xng”  
nên khnăng mrng mng bhn chế.  
Ngoài ra, còn có các ng dng khác như là: BitTorrent, WinMX, Audiogalaxy…vv.  
Ưu đim :  
- Tìm kiếm nhanh và hiu qu.  
- Qun lý tp trung/ qun trtin cy.  
- Dxây dng.  
Nhược đim:  
- Ddàng btn công.  
- Nút cchai.  
- Khnăng tc nghn.  
- Khó mrng.  
- Cn qun tr.  
13  
1.2.2.2. Mng ngang hàng thun túy  
Mng ngang hàng thun túy là mt kiu mng ca thế hmng ngang hàng thnht,  
đặc trưng ni bt ca mô hình này là không có máy chtìm kiếm tp trung như trong mô  
hình mng ngang hàng tp trung, do đó nó không gp phi vn đề nút cchai. Các đim  
nút giao tiếp trc tiếp vi đim nút khác trong mng mà không cn các máy chtrung tâm  
riêng bit nào, các đim nút thiết lp kết ni vi nhau ngu nhiên.  
Trong mô hình mng ngang hàng này, vic tìm kiếm file sdng phương pháp phát  
tràn (phương pháp này có sdng giá trgii hn phm vi tìm kiếm là TTL và sdng  
GUID để trao đổi). Khi mun tìm kiếm mt file nào đó thì yêu cu tìm kiếm được gi từ  
đim nút ngun ti tt ccác đim nút mng là hàng xóm ca nó. Đây va là đặc trưng  
hp dn ca mng ngang hàng thun túy và cũng là mt đim yếu ca các mng ngang  
hàng này bi vì phương pháp tìm kiếm làm tăng đáng klưu lượng trong mng và gây ra  
dư tha hay trùng lp thông báo truy vn. Nếu tài nguyên được tìm thy là tn ti thì khi  
đó đim nút có tài nguyên chia sstrao đổi vi đim nút yêu cu da vào GUID ca  
đim nút yêu cu.  
đặc trưng ca mô hình mng này là không có máy chtìm kiếm trung tâm nên  
vic mt đim nút mi gia nhp vào mt mng sthế nào, thc hin tìm kiếm ra sao là  
vn đề cn được làm rõ. Da vào ng dng phn mm đin hình cho mô hình mng này là  
phn mm Gnutella 0.4, chúng tôi smô tsơ lược cách thc mt đim nút tham gia vào  
mng và cách thc thc hin tìm kiếm.  
Đim nút A tham gia vào mng Gnutella (Hình 4):  
(1) Đim nút A kết ni ti GnuCache (GnuCache được sdng để cache các host  
Gnutella và được tích hp bên trong phn mm Gnut cho unix) để ly danh sách các  
đim nút có giá trđã được kết ni trong mng.  
(2) GnuCache gi trdanh sách mà mình có cho đim nút A.  
(3) Đim nút A sau khi nhn danh sách, trong danh sách ca nó có duy nht đim nút  
B, nó gi thông báo GNUTELLA CONNECT (thông báo dùng để kết ni ti các đim  
nút đã tn ti trong mng.) ti đim nút B.  
(4) Nếu đim nút B chp nhn thông báo ca đim nút A thì nó sgi thông báo  
GNUTELLA OK, và htrợ đim nút A tham gia vào mng. Bây giờ đim nút A đã là  
14  
mt phn ca mng Gnutella và đã được kết ni ti mt đim nút Gnutella khác là  
đim nút B.  
Đ
nút D  
im  
Đ
nút E  
im  
(3)  
(2)  
(2)  
GnuCahe  
(3)  
Đ
im  
nút C  
(2)  
Đ
im  
nút X  
(1)  
(2)  
(1)  
(3)  
Đ
im  
nút A  
Đ
im  
Đ
im  
nút B  
nút Y  
(4)  
(1)  
Hình 4.Mô tmt nút tham gia vào mng Gnutella và tìm kiếm file.  
Đim nút A tìm kiếm tài nguyên (Hình 4):  
Để biu din cách thc tìm kiếm được sdng trong mng Gnutella,các ký hiu (1),  
(2),(3) bên phi đim nút B trên Hình 4, thhin chng thi, còn mũi tên biu thcác  
hàng xóm có thlan ta được ca đim nút ti chng đó.  
- Đim nút A sau khi tham gia vào mng, khi nó cn file nào đó nhưng nó li không có  
file đó, nó stiến hành tìm kiếm file đó trên mng. Vì đim nút A li không có thông  
tin gì ngoài thông tin ai là hàng xóm ca nó nên nó gi thông báo truy vn (đim nút  
A trong trường hp này chgi 1 thông báo vì nó chcó mt hàng xóm) ti hàng xóm  
ca nó là đim nút B để hi B có tài nguyên nó cn hay không.  
- Đim nút B sau khi nhn được thông báo yêu cu ca đim nút A, đầu tiên nó skim  
tra thông báo có phi là mt thông báo cũ hay không. Nếu là mt thông báo mi thì nó  
skim tra thông tin mà đim nút A yêu cu bng cách ánh xtkhóa yêu cu trong  
thông báo truy vn ti cơ sdliu ca nó. Nếu nó có dliu mà đim nút A cn thì  
nó sgi li thông báo queryHit cho đim nút A. Quá trình truy vn dng li, và thc  
15  
hin trao đổi dliu gia đim nút A và đim nút B, vic trao đổi là trc tiếp gia 2  
đim nút. Nếu đim nút B không có tài liu mà đim nút A cn thì nó sgim giá trị  
TTL trong thông báo truy vn đi 1 và chuyn tiếp thông báo truy vn ti các hàng xóm  
ca nó là X, Y.  
- Đim nút X và đim nút Y lúc này thc hin quá trình tương tnhư đim nút B. Ti  
đim nút E nhn được nhiu thông báo truy vn do từ đim nút X và đim nút Y gi  
đến.  
- Đim nút C và E li chuyn tiếp ti đim nút D, và ti đim nút D có tài liu mà đim  
nút A cn. Gisử đim nút C gi thông báo đầu tiên ti đim nút D khi đó thông báo  
do đim nút E gi thông báo truy vn ti đim nút D bloi b(đây là cách ti ưu cho  
tìm kiếm và hn chế truy vn lp ti các đim nút có tài nguyên). Đim nút D gi cho  
đim nút A thông báo queryHit theo đường tD-C-X-B-A. Nhn được queryHit ca  
D, bây giờ đim nút A đã có địa ch, scng mà D cung cp, khi đó vic trao đổi file  
din ra trc tiếp gia D và A, không theo tuyến đường đã tìm thy D.  
Ví dvvic tham gia vào mng ca mt đim nút, cũng như cách thc tìm kiếm ca  
mt đim nút trong mng Gnutlla có ththam kho thêm thông tin trong các tài liu  
[3], [12], [13].  
Ngoài ra ng dng đin hình còn có các ng dng khác như là: FreeNet, Gnu-  
Net…vv.  
Ưu đim:  
- Không đim duy nht chu li khó btn công.  
- Có ththích nghi vi mng vt lý.  
- Cho phép nc danh.  
- Dxây dng.  
- Các đim nút tham gia và ri khi mng mt cách tùy mà không nh hưởng đến cu  
trúc ca toàn mng.  
Nhược đim:  
- Tn tài nguyên băng thông.  
16  
- Tìm kiếm phc tp  
- Các đim nút có khnăng khác nhau (sc mnh xlý ca CPU, băng thông, không  
gian lưu tr…vv.) đều có thphi chu ti như nhau.  
Như vy, qua ví dvi ng dng Gnutella chúng tôi đã trình bày vcách thc mt  
đim nút mi tham gia vào mng ngang hàng thun túy như thế nào và cách thc mt  
đim nút tìm kiếm tài liu trong mng đó. Đồng thi cũng nêu ra nhng ưu đim, nhược  
đim ca mng này khi đặc trưng ca nó là không có máy chtìm kiếm trung tâm.  
1.2.2.3. Mng ngang hàng lai  
Mng ngang hàng lai là mng ngang hàng thuc thế hth2. Chúng được phát trin  
để khc phc nhược đim ca các mô hình mng ngang hàng trước đó. Mô hình mng  
ngang hàng lai bao gm các: các siêu đim nút, các đim nút thông thường (hay còn gi là  
đim nút client). Trong đó các siêu đim nút to thành mt mng không có cu trúc, và  
mi siêu đim nút kết ni đến nhiu đim nút thông thường, mi siêu đim nút qun lý  
vùng ca nó, vai trò ca siêu đim nút ging như mt máy chtrong mô hình mng ngang  
hàng tp trung.  
ng dng đin hình cho mô hình mng này là: Gnutella 0.6, Kazaa/FastTrack.  
Ngoài ra còn có: Edonkey, Emule, OpenNap, JXTA, Skype…vv.  
Ưu đim:  
- Không đim duy nht chu li vì có nhiu siêu đim nút.  
- Cho phép nc danh.  
- Phù hp vi các nhóm li ích đặc bit.  
- Khnăng mrng quy mô tt.  
- Hiu qutha mãn các truy vn.  
- Hn chế phát tràn các truy vn và tránh được hin tượng nút cchai.  
Nhược đim:  
- Phân chu ti không cân bng: các siêu đim nút chu ti cao hơn.  
17  
1.3. Mng xếp chng  
Là mng máy tính được xây dng trên nn ca mt mng khác. Các nút trong mng  
xếp chng được xem là ni vi nhau bng liên kết o (liên kết logic), mi liên kết o có  
thbao gm nhiu liên kết vt lý ca mng nn.  
Có rt nhiu mng ngang hàng được gi là mng xếp chng vì nó được xây dng và  
hot động trên nn ca mng Internet. Ví dnhư: Gnutella, FreeNet…vv.  
18  
CHƯƠNG 2. LÝ THUYT ĐỒ THVÀ CÁC DNG ĐỒ  
THMNG  
Đồ thlà mt mô hình toán hc được sdng để biu din mt tp đối tượng có  
quan hvi nhau theo mt cách nào đó. Chng hn trong rt nhiu vn đề, lĩnh vc khác  
nhau như công nghệ đin, hoá hc, chính tr, kinh tế,..vv, cũng có thbiu din bi đồ th.  
Trong lĩnh vc tin hc, đồ thị được sdng để mô hình hoá mt mng truyn thông, kiến  
trúc ca các máy tính song song,...vv. Vì khóa lun ca chúng tôi có liên quan đến đồ thị  
nên trong chương này chúng tôi strình bày nhng ni dung ca Lý thuyết đồ thphù hp  
vi vn đề ca chúng tôi. Tiếp đó chúng tôi sgii thiu các dng đồ thmng truyn  
thông được sdng cho mô phng trong khóa lun ca chúng tôi. Tìm hiu vcác dng  
đồ thnày sgiúp cho vic tìm hiu hot động ca các phương pháp tìm kiếm mà chúng  
tôi trình bày phn ni dung tiếp theo ca bài báo, cũng như phc vcho mô phng ca  
chúng tôi.  
2.1. Khái nim đồ thị  
2.1.1. Đồ th có hướng  
Đồ thhướng là đồ thbao gm tp các đỉnh V={1,2,..,n}, và tp các cung E. Mi  
cung là 1 cp có thtca các đỉnh (u,v) tương ng vi mt liên kết có hướng tu ti v.  
Bc ra ca mt đỉnh u là slượng các các cung (liên kết) xut phát tu, và bc vào  
là slượng các cung ti u.  
Mt đường đi tu ti v là mt dãy các cung (u,u1), (u1,u2), (u2,u3), .., (uk,v). Có  
đường đi tu ti v không bao hàm nghĩa đây là đường đi tv ti u.  
Đồ thcó hướng được gi là liên thông mnh nếu vi mi cp đỉnh u và v khác nhau  
trong tp nút bao gicũng có mt đường đi tu ti v. Đồ thcó hướng có nhiu hơn mt  
thành phn liên thông mnh.  
2.1.2. Đồ th vô hướng  
Mt đồ thvô hướng là mt đồ thbao gm 1 tp các đỉnh và tp các cnh, mi mt  
cnh trong đó là mt cp đỉnh không có tht{u,v}.  
Bc ca mt đỉnh u là slượng các cnh liên quan ti u (hàng xóm ca u).  
19  
Đường đi trong đồ thvô hướng khác vi đồ thcó hướng là đường đi tu ti v thì  
có hàm ý là đường đi tv đến u.  
Mt thành phn liên thông ca đồ thvô hướng là mt tp các đỉnh sao cho mi cp  
đỉnh u và v bt kbao gicũng có đường đi tu ti v. Thành phn liên thông ca đồ thị  
vô hướng thu được tthành phn liên thông ca đồ thcó hướng sau khi loi bhướng  
ca các cung.  
2.1.3. Các khái nim khác  
Đồ thị đơn là đồ thkhông có khuyên và bt k2 đỉnh phân bit nào cũng được ni  
vi nhau bi không quá mt cnh.  
Đồ thị đa là đồ thkhông có khuyên và tn ti mt cp đỉnh phân bit được ni vi  
nhau bi nhiu hơn mt cnh.  
Đồ thị đy đủ, ký hiu Kn là mt đơn đồ thbao gm n đỉnh mà mi đỉnh đều có bc  
n-1.  
Để tìm hiu rõ hơn vlý thuyết đồ th, bn đọc có thể đc trong tài liu [1], [8], [18].  
Trong phn tiếp theo chúng tôi strình bày ng dng đồ thtrong mng truyn thông, cụ  
thlà mô hình hóa các mô hình mng ngang hàng thành các dng đồ thtương ng.  
2.2. Các dng đồ thtrong mng ngang hàng  
Khi xem xét mô hình hóa mt mng ngang hàng bi mt đồ ththì khi đó khái nim  
tp V={1,2,3,..,n} ca đồ thG=(V,E) gi là tp n đim nút hay nút trong mng, mi đim  
nút được cung cp mt định danh ID và địa chmng . Và E là tp các kết ni gia các  
đim nút hay tp các cnh gia các đỉnh trong tp V. Vi u, v V; {u,v} E biu thị  
rng các đim nút u và v biết địa chIP ca nhau, gia chúng tn ti kết ni, u và v còn  
được gi là hàng xóm ca nhau, u là nút ngun, v là nút đích. Tt ccác cnh là liên kết  
có hướng vi nhau.  
Trong mô hình hóa mng dưới dng đồ thcó thlà có 1 hay 2 hướng liên kết, còn  
trong mô hình vt lý thc, thì chcó 1 liên kết vt lý gia các peer vi nhau hoc 1 liên  
kết trong mô hình hóa li có nhiu liên kết vt lý qua nhiu máy trung gian tng mng.  
Vì vy, đồ thG đôi khi còn được gi là “mng xếp chng” ca mt hthng mng ngang  
hàng.  
20  
Có nhiu dng đồ ththa mãn mô hình mng ngang hàng thun túy này như là : đồ  
thngu nhiên, đồ thlut hàm mũ, tô pô phân cm. Đây cũng là nhng dng đồ thchung  
cho mng ngang hàng. Vì vy chúng tôi smô phng nhng phương pháp tìm kiếm trên  
nhng dng đồ thnày để đánh giá xem phương pháp nào tt, phương pháp nào ti.  
2.2.1. Đồ th ngu nhiên  
Mt đồ thngu nhiên là mt đồ thị được sinh ra bi nhiu thtc ngu nhiên. Có  
nhiu cách để định nghĩa các đồ thngu nhiên. Cách đơn gin nht, được biu thbng  
Gn,m , trong đó n là số đỉnh ca đồ th, các đỉnh được la chn ngu nhiên để xây dng đồ  
th, và m là scnh có thca đồ th, vi 0 m ( ). Định nghĩa này là định nghĩa đồ  
ththeo mô hình ca Erdo˝s and Renyi, chi tiết thông tin tham kho trong các tài liu [10],  
[12], [18].  
Mt biu din khác về đồ thngu nhiên được đưa ra trong tài liu [12], [18] là Gn,p  
trong đó 0 p 1, các đỉnh là ging nhau nhưng la chn cnh có thvi xác sut p, độc  
lp vi tt ccác cnh khác, đây là định nghĩa ca mô hình Gilbert. Gi z là bc trung  
bình ca 1 đỉnh thì:  
z = ꢁ(ꢁꢂꢃ)ꢄ = (n-1)p np  
(1)  
Độ xp xcàng tt khi n càng ln.  
Như vy, đồ thngu nhiên được xây dng theo cách thc hoc giá trngu nhiên ti  
mi bước xây dng đồ th. Dng đồ thnày làm cơ scho xây dng các dng đồ thkhác,  
và sdng trong mô phng.  
2.2.2. Đồ th lut hàm mũ  
Đồ thlut hàm mũ có tên tiếng Anh là “power-law” hay “scale-free networks. Đồ  
thnày được xây dng bi 3 anh em: Michael, Petros và Christos Faloutsos, thông tin về  
lch sra đời ca đồ thcó ththam kho thêm trong tài liu [12].  
Đồ thlut hàm mũ đồ thtrong đó tt ccác trang web (web tĩnh) đã thăm được  
biu din như là các nút, và 2 trang được kết ni bi 1 cnh (i,j) có hướng nếu trang i có 1  
liên kết đim ti trang j. Trong đồ th, slượng các nút cùng vi bc quy định đã được  
tính toán bng vic phân chia bc bi slượng các nút trong đồ th, xác sut P (k) để v1  
21  
nút ngu nhiên vi bc k đã được tính toán là như nhau. Xác sut P (k) là tlvi hàm mũ  
ca k vi 1 hng số γ.  
P(k) k γ  
(2)  
Trong đó γ là hng skhông phthuc vào kích thước ca mng, và trong mô  
phng ca chúng tôi thì γ =2.1 cho các bc vào, γ = 2.7 cho các bc ra, để hiu rõ hơn có  
ththam kho theo tài liu [11], [14], [19].  
Có nhiu mô hình cho đồ thweb, nhưng trong chương trình mô phng ca chúng  
tôi, chúng tôi la chn mô hình “Protean Model”. Mô hình này yêu cu tính toán mt  
tham stnhiên thêm vào ca mt đỉnh, đó là age và dự đoán nó sẽ ảnh hưởng thế nào  
đến bc ca mt đỉnh. Vi đồ thG có tp n đỉnh và ti bước nào đó chn ngu nhiên mt  
trong nhng đỉnh v ca tp đỉnh để thay đổi mi (renewed ). Chính xác hơn, xóa btừ đồ  
thG tt ccác cnh phthuc vào đỉnh v, vic này tương ng vi vic xóa bmt nút  
ngu nhiên tmng. Sau đó to ra d cnh mi từ đỉnh v vi các đỉnh đã tn ti, các đỉnh  
này được la chn ngu nhiên vi các xác sut có trng s(các đỉnh ‘cũ’ có xác sut cao  
hơn để chn la ). Lưu ý rng đỉnh v có thể được coi như là mt nút mi, nút mà thiết lp  
kết ni vi mt vài nút trong mng. Khi tt ccác đỉnh là thay mi ti thiu 1 ln, đồ thị  
ngu nhiên là mt đồ thprotean P n(d,η), thông tin tham kho thêm trong tài liu [11],  
[14], [19].  
Trong tài liu [11] ca tác giđồng nghip đưa ra rng các bc ca P n(d,η) là  
được phân phi phù hp vi mt lut hàm mũ. Chính xác hơn, slượng các đỉnh bc k  
gim mnh k-1-1/η  
.
Trong mô phng chúng tôi thc hin kim tra vi bc trung bình là 5.  
2.2.3. Tô pô phân c  
m  
Mt đồ thG=(V,E) được gi là mt tô pô phân cm (cluster topo) nếu mi thành  
phn liên thông ca G là mt đồ thị đầy đủ. Đồ thG cũng được gi là mt p-phân cm  
(p-cluster) nếu nó là 1 tô pô phân cm vi p thành phn liên thông hoc tương đương nếu  
nó là phép toán hp các đỉnh ri khi mng ca p phân cm, tham kho thêm trong [15].  
22  
Trong chương trình mô phng, vi dng đồ thnày sdng 3 mô hình phân cm đó  
- Kl để phân kích ccm.  
là :  
- Đồ thngu nhiên Gl,1/2  
- Đồ thngu nhiên Gl,1/5  
.
.
Kích thước ca các phân cm trong mô hình này là l=100.  
Như vy, trong chương này chúng tôi đã trình bày khái nim cơ bn vlý thuyết đồ  
thvà các dng đồ thmng được sdng chung cho mng ngang hàng cũng như cho  
mng ngang hàng thun túy.  
23  

Tải về để xem bản đầy đủ

pdf 76 trang yennguyen 22/06/2025 300
Bạn đang xem 30 trang mẫu của tài liệu "Khóa luận Tìm kiếm ngẫu nhiên trên các mạng ngang hàng phi cấu trúc", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfkhoa_luan_tim_kiem_ngau_nhien_tren_cac_mang_ngang_hang_phi_c.pdf