Khóa luận Giải hệ phương trình tuyến tính kích thước lớn trên nền tảng Grid Computing

ĐẠI HC QUC GIA HÀ NI  
TRƢỜNG ĐẠI HC CÔNG NGHỆ  
Nguyễn Đức Thnh  
GII HỆ PHƢƠNG TRÌNH TUYẾN TÍNH KÍCH  
THƢỚC LN TRÊN NN TNG GRID  
COMPUTING  
KHOÁ LUN TT NGHIỆP ĐẠI HC HCHÍNH QUY  
Ngành: Công nghthông tin  
Cán bộ hƣớng dn: Tiến sĩ. Nguyễn Minh Hng  
HÀ NI - 2010  
Li cảm ơn  
Trước hết là li cảm ơn sâu sc của em đến những người đã giúp đỡ em hoàn  
thành khóa lun tt nghip này, mt du mu quan trng trong cuộc đời và snghip ca  
em.  
Em xin chân thành cảm ơn Khoa công nghệ thông tin trường đại hc Công Ngh-  
Đại hc quc gia Hà Nội đã tạo điu kin cho em đưc thc hin khóa lun này.  
Khóa lun skhông thhoàn thành nếu thiếu schbo tn tình ca TS.Nguyn  
Minh Hằng, người đã định hướng, htrem trong sut thi gian 3 tháng thc hin khóa  
lun. Em xin chân thành cảm ơn cô.  
Mt li cảm ơn từ đáy lòng con xin được gửi đến cha m, những người đã nuôi  
nấng con thành người để được có ngày hôm nay.  
Em xin cảm ơn các quý thầy cô đã dạy dem trong suốt 4 năm học ở nhà trường,  
cung cp cho em nhng kiến thức quý báu để bước vào đời.  
Cảm ơn các bạn của tôi đã là những người động viên tinh thần cũng như ở bên tôi  
giúp đỡ tôi khi tôi gặp khó khăn.  
Thi gian 3 tháng va qua, mặc dù đã cố gắng để hoàn thành khóa lun mt cách  
tt nhất nhưng vẫn không thtránh ni nhng sai sót. Em xin kính mong nhn được sự  
góp ý cũng như chỉ bo ca quý thy cô. Xin chân thành cảm ơn  
Sinh viên  
Nguyễn Đức Thnh  
Mc lc  
Li mở đu  
Trong thp niên qua, nn công nghthông tin thế gii phát triển đã đóng góp rất  
nhiu vào sphát trin chung ca thế gii. Chúng ta có thbt gp nhng ng dng ca  
công nghthông tin khp mọi nơi, giờ đây nhiều người shu máy tính cá nhân, shu  
nhng chiếc điện thoi, cp nhp thông tin qua nhng trang web, kết ni vi nhau qua  
nhng phn mềm chat… Đấy là nhng thhin hu hàng ngày mà chúng ta trc tiếp sờ  
thy và sdng nó, n sau nó là nhng nghiên cu, nhng công nghệ được rt nhiu nhà  
khoa học cũng như phát triển trên thế gii nghiên cứu để đóng góp vào sự phát trin ca  
nn công nghthông tin nói riêng và nn khoa hc thế gii nói chung.  
Khi nói đến máy tính, mt khái niệm hay được nhắc đến là nhng chiếc máy tính  
để bàn nhgn hay nhng chiếc laptop cá nhân. Nhưng đó là những thiết bcá nhân giúp  
chúng ta gii trí, làm vic, còn vi nhng chiếc máy tính phi xử lý lượng dliu tkhp  
nơi trên thế gii một cách thường xuyên và liên tục thì sao. Khi đó ,chúng ta lại được bt  
gp khái nim siêu máy tính (Super Computer) . Nhng siêu máy tính trên thế giới được  
xây dng rất đắt tin với hàng trăm ngàn hay hàng triệu bvi xử lý, để đầu tư cho những  
hthống máy như vậy tn rt nhiu tin ca cho vic trin khai cũng như bảo dưỡng, vi  
mục đích sử dng kết ni những người dùng hay tchc có chung mt mục đích xlý  
hay tn dng tài nguyên máy tính ca bt kỳ người dùng máy tính nào để to thành mt  
hthng mnh mphc vcho vic gii các bài toán vkhoa hc, thương mại, một lĩnh  
vc nghiên cu mới được đưa ra, đó là Grid Computing. Nói mt cách tng quát nht  
Grid là mt loi hthng phân tán, btrí song song, cho phép linh hot chia s, tuyn la  
và tp hp các nguồn tài nguyên độc lp và ri rác về địa lý, tùy theo khả năng sẵn có,  
công sut, hoạt động, chi phí và yêu cu vchất lượng dch vcủa người sdng. Grid  
Computing có rt nhiều ưu điểm mà có tháp dng cho vic nghiên cứu cũng như những  
ưu điểm có tháp dng cho doanh nghip.  
Trên thế giới, ý tưởng vGrid Computing đã được hình thành và nghiên cu trt  
lâu nhưng thực sbùng nổ vào vài năm trở lại đây khi được các tchức cũng như tập  
đoàn lớn trên thế gii nghiên cu và trin khai. Ti Vit Nam, công vic nghiên cu Grid  
Computing đã được trin khai tkhá lâu và gần đây nhất là đề tài cấp nhà nước “Nghiên  
cu, phát trin hthống tính toán lưới để htrgii quyết các bài toán có khối lượng tính  
1
 
toán lớn (VNGrid)” do PGS.TS. Vũ Đức Thi làm chnhim cũng đã đạt được mt số  
thành tu nhất định.  
Nhn thy Grid computing là một hướng nghiên cu đang rất được quan tâm ti ở  
Vit Nam cũng như thế gii và nhng li ích to ln mà nó mang li. Em quyết định chn  
đề tài “Giải gii hệ phương trình tuyến tính kích thước ln trên nn tảng Grid Computing”  
vi mục đích là tìm hiểu Công nghGrid là gì ,nhng khái niệm và đặc điểm liên quan,  
thí nghim to mt hthng Grid nhbng gói phn mm GLOBUS TOOLKIT cùng  
MPICH-G2 để kim nghim hiệu năng ca hthng grid khi chy bài toán Gii hệ  
phương trình tuyến tính kích thước ln.  
2
Tóm tt khóa lun  
1. Thông tin chung vkhóa lun  
Tên đề tài : Gii hệ phương trình tuyến tính trên nn tng Grid Computing  
Giảng viên hưng dn : TS.Nguyn Minh Hng  
Sinh viên thc hin : Nguyễn Đức Thnh  
2. Tóm tt ni dung khóa lun  
Khóa lun thc hin nghiên cu tìm hiu các vấn đề chung ca công nghGrid về  
mt khái nim, kiến trúc ca mt hthng Grid và nhng ích li ca Grid mang li. Cung  
cp mt cái nhìn tng quan vGrid.  
Tìm hiu mô hình hoạt động ca gói phn mm Globus Toolkit, mt gói phn mm  
giúp xây dng mt hthng Grid, các vấn đề khi thc hin trin khai to dng mt hệ  
thng Grid vi Globus Toolkit.  
Tìm hiu vMPICH, MPICH-G2, nguyên tc hoạt động ca MPICH kết hp vi  
Globus Toolkit để to dng hthng Grid phc vvic tính toán song song sdng ngôn  
ngC và MPI.  
Thnghim bài toán gii hệ phương trình tuyến tính theo thut toán song song trên  
mt hthống Grid để xem cách thc hoạt động và ưu điểm vkhả năng kết hp xlý  
gia các máy tính khác nhau.  
3. Các công cụ đƣợc sdng trin khai và thnghim  
Globus Toolkit 4.2.1  
Centos 5.4  
MPICH-1.2.7  
3
   
Chương 1 : Tng quan vcông nghGrid Computing  
1.1. Lch sphát trin ca công nghGrid  
Trong những năm gần đây, chúng ta được nghe nhiều đến công nghGrid và  
những ưu điểm ca nó. Vy Grid xut hin tkhi nào, tbao gi? Trong quá kh, nhng  
ý tưởng tính toán có liên quan đến Grid đã xuất hin, vi nhng tên gi khác nhau và cách  
tiếp cn khác nhau.  
Ví dụ như ý tưởng “chia sẻ năng lực tính toán” đã xuất hin tnhững năm 60-70  
ca thế kỷ XX, lúc đó toàn bộ năng lực tính toán được chia stcác máy mainframe.  
Năm 1965, những người phát trin hệ điều hành Multics (tin thân ca hệ điều hành  
Unix) đã đề cập đến vic sdụng năng lực tính toán như là một tin ích, một quan điểm  
rt gn với quan điểm vGrid hiện nay. Đó là một hthng cung cấp năng lực tính toán  
tương tự như hệ thng cung cấp điện, nước hiện đang được sdng trong cuc sng hàng  
ngày. Người dùng khi mun sdụng tài nguyên tính toán để xlý công vic, chcn cm  
thiết bvào hthng cung cp, sdng và trtin giống như khi cắm thiết bị điện vào  
lưới điện.  
Tuy trước đó đã có nhiều ý tưởng về Grid nhưng nguồn gc ca Grid chính thc  
được xác định vào năm 1990, khi thuật ngữ “siêu tính toán” (metacomputing) ra đời, dùng  
để mô tcác dán kết ni các trung tâm siêu máy tính ca Mnhm kết hp sc mnh  
xlý ca nhiu siêu máy tính li vi nhau.  
Đến năm 1995, 2 dự án siêu tính toán quan trng, ảnh hưởng lớn đến các công  
nghnn tng trong các dán Grid ngày nay là FAFNER (Factoring via Network-  
Enabled Recursion) và I-WAY(Information Wide Area Year) ra đời.  
Khái niệm Grid ra đời phòng thí nghim Argonne National Laboratory vào tháng  
7/1997, sau đó được đưa vào quyển sách "The Grid: Blueprint for a New Computing  
Infrastructure" viết bi tiến sIan Foster (Argonne National Laboratory) và Carl  
Kesselman (University of Southern California) năm 1998. Ian Foster đã từng tham gia dự  
án I-WAY, Carl Kesselman là người tham gia dán Globus Toolkit, mt dán nn tng  
ca công nghGrid và Metacomputing.  
4
 
Từ đó đến nay, vic phát trin công nghGrid trnên rất sôi động vi stham gia  
nghiên cứu, đầu tư của nhiu tchc, tp đoàn công nghệ thông tin, nhiu quốc gia, và đã  
thu được nhng thành tựu bước đầu. Có thnói, vic phát trin và xây dng hthng  
Grid là skế tha và phát triển các ý tưởng, các công nghhin hành mức cao hơn. Sự  
phát trin không ngng của cơ sở htng, phn cng máy tính, mạng đã giúp các hệ  
thng Grid ngày nay thc hiện được nhiều điều hơn những ý tưởng trước đây.  
1.2. Khái nim  
Một định nghĩa về Grid khá hoàn chỉnh được đưa ra bởi tiến sỹ Ian Foster như sau  
“Grid là một loi hthng song song, phân tán cho phép chia s, la chn, kết hp các  
tài nguyên phân tán theo địa lý, thuc nhiu tchc khác nhau da trên tính sn sàng,  
khả năng, chi phí của chúng và yêu cu vchất lượng dch v(QoS) của người dùng để  
gii quyết các bài toán, ng dng có quy mô ln trong khoa hc, kthuật và thương mại.  
Từ đó hình thành nên các “tổ chc ảo” (Virtual Organization (VO)), các liên minh tạm  
thi gia các tchc và tập đoàn, liên kết với nhau để chia stài nguyên và/hoc kỹ năng  
nhằm đáp ứng tốt hơn các cơ hội kinh doanh hoc các dán có nhu cu ln vtính toán  
và dliu, toàn bvic liên minh này da trên các mạng máy tính”  
Mt hthng Grid có những đặc trưng như sau:  
Có skết hp, chia sẻ các tài nguyên không được qun lý tp trung Grid tích hp  
và phi hợp tài nguyên, người dùng thuc nhiu vùng qun lý khác nhau, nhiu  
đơn vị khác nhau trong mt tchc, hay nhiu tchc khác nhau. Công nghGrid  
tp trung gii quyết các vấn đề vbo mt, chính sách qun tr, chi phí, thành  
viên,… nảy sinh trong quá trình chia svà sdng tài nguyên.  
Sdng các giao din và giao thc chun, mang tính mở, đa dụng. Grid được xây  
dng trên các giao thc và giao din tổng quát, đa dụng đgii quyết các vấn đề cơ  
bản như chng thực người dùng, phân quyn, tìm kiếm và truy xut tài nguyên.  
Đáp ứng yêu cu cao vchất lượng dch v. Grid cho phép sdng phi hp các  
tài nguyên để cung cp nhiu loi dch vvi các mc chất lượng khác nhau, liên  
quan đến ví dụ như thời gian đáp ứng, hiu sut, tính sn sàng, bo mt, cho phép  
kết hp nhiu kiểu tài nguyên để đáp ứng nhu cu phc tp của người dùng. Mc  
tiêu là phi phi hợp làm sao để khả năng của hthng sau khi kết hp phi ln  
hơn hẳn tng khả năng của từng đơn vị cu thành nên Grid.  
5
 
1.3. Các kiu tài nguyên ca Grid  
1.3.1. Tài nguyên tính toán  
Đây là tài nguyên phổ biến nht, là các chu kỳ tính toán (computing cycles) được  
cung cp bi bvi xlý ca các thiết btrong Grid. Các bvi xlý không cn phi cùng  
loi mà có thcó tốc độ, kiến trúc, chy phn mềm khác nhau. Có 3 cách để khai thác tài  
nguyên tính toán ca Grid:  
1. Cách đơn giản nht là chy các ng dng hin có trên mt node ca Grid thay vì chy  
trên máy tính cc b.  
2. Thiết kế ứng dng, tách các công vic thành các phn riêng rẽ để có ththc thi song  
song trên nhiu bxlý khác nhau.  
3. Chy ng dng thc thi nhiu ln trên nhiu node khác nhau trong Grid.  
1.3.2. Tài nguyên lƣu trữ  
Tài nguyên phbiến thứ nhì trong Grid là tài nguyên lưu trữ. Mi thiết btrong  
Grid thường cung cp mt số dung lượng lưu trữ phc vcho vic thc thi ng dng trên  
Grid. Tài nguyên lưu trữ có thlà bnhtrong, ổ đĩa cứng hoc các thiết bị lưu trữ khác.  
Bnhớ trong thường dùng để lưu trữ dliu tm thi cho ng dng, trong khi các thiết bị  
lưu trữ ngoài có thể được sdụng để tăng không gian lưu trữ, tăng hiệu sut, khả năng  
chia sẻ và đảm bo tính tin cy ca dliu.  
1.3.3. Phƣơng tiện liên lạc  
Khả năng liên lạc gia các máy tính phát triển nhanh chóng đã giúp cho công nghệ  
Grid trnên hin thực, do đó đây cũng là một tài nguyên quan trng. Ở đây bao gồm vic  
liên lạc, trao đổi dliu gia các thành phn trong Grid và giao tiếp gia Grid vi bên  
ngoài. Mt scông việc đòi hỏi một lượng dliu lớn nhưng các dữ liệu này thường  
không nằm trên máy đang thực thi công vic. Khả năng về băng thông trong những  
trường hợp như vậy là mt tài nguyên then cht, ảnh hưởng đến khả năng của Grid.  
Vic giao tiếp với bên ngoài được thc hin thông qua mng Internet. Grid có thể  
sdng các kết nối Internet để liên lc gia các node. Vì các kết ni này không chia sẻ  
một đường truyền nên làm tăng băng thông truy cập Internet. Các đường truyn dphòng  
đôi khi cần thiết để gii quyết tốt hơn các vấn đề về hư hỏng mng và truyn dliu ln.  
6
       
1.3.4. Phần mềm, ứng dụng  
Grid có thể được cài đặt các phn mm mà có thquá mắc để cài trên tt cmi  
máy tính trong Grid. Các phn mm này chcần được cài trên mt snode. Thông qua  
Grid, khi mt công vic cần đến chúng, nó sgi dliệu đến node đã được cài đặt phn  
mm và cho thực thi. Đây có thể là mt gii pháp tốt để tiết kim chi phí vbn quyn  
phn mm.  
1.3.5. Các thiết bị đặc biệt  
Là các thiết bdùng trong khoa hc, kthuật như kính viễn vng, các bcm biến  
(sensor),… Các thiết bnày chyếu thu thp các dliu khoa hc, phc vụ cho các bước  
phân tích, xlý sau này.  
Ghi chú: Các tài nguyên trên đây đến tnhiu ngun khác nhau, có thkhông thuc quyn qun  
lý ca mt tchc, ca một đơn vị mà có ththuc nhiu tchc, nhiều nơi khác nhau. Một số  
tài nguyên có thể được sdng tdo, trong khi mt số khác được sdụng dưới nhng chính  
sách nhất định. Các tài nguyên được “ảo hóa” (virtualize) để che du sphc tạp, đa dạng  
nhằm đưa ra một cái nhìn thng nhất, đơn giản vtoàn bộ tài nguyên trên Grid sao cho dưới mt  
của người dùng, các tài nguyên Grid là mt khi thng nht.  
1.4. Phân lai các hthng Grid  
Công nghGrid Computing có thể được sdng theo nhiều cách khác nhau đgii  
quyết các loi yêu cu ng dụng. Thông thường Grid được phân loi bi kiu ca ng  
dng cn gii quyết. Có 3 loại Grid như trình bày dưới đây. Tuy nhiên không có ranh gii  
phân bit rõ ràng gia các loi Grid và trong thc tế, các gii pháp Grid thường là skết  
hp 2 hay nhiu loi khác nhau.  
1.4.1. Grid Tính toán (Computation Grid)  
Loi Grid này tp trung chyếu vào vic sdụng năng lực tính toán. dng Grid  
này, phn ln các node là các máy tính hay các nhóm máy tính(cluster) có năng lực xlý,  
tính toán rt ln. Hình thc thc hin là chia tác vtính toán ln thành nhiu công vic  
nhthc thi song song trên các node ca Grid. Vic phân tán các tác vtính toán trong  
Grid slàm gim rất đáng kể toàn bthi gian xử lý và tăng khả năng tận dng hthng.  
Thông thường mt hthng chính schia khi dliu cn xlý thành các phn nh, sau  
7
       
đó phân phối đến các node trên Grid. Mi node sthc hin xlý dliuvà trkết quvề  
hthống chính để hnày tng hp và trình din kết qutoàn cc cho người dùng  
1.4.2. Grid Dữ liệu (Data Grid)  
Ở đây, không gian lưu trữ là tài nguyên. Mt Grid Dliu chu trách nhim lưu trữ  
và cung cp khả năng truy cập dliu cho nhiu tchức khác nhau. Người dùng không  
cn biết chính xác vtrí dliu khi thao tác vi dliu. Các cơ sở dliệu, đặc biệt các cơ  
sdliu liên hợp, đóng vai trò quan trng trong các Grid Dliu, nht là khi có nhiu  
ngun dliu và xut hin nhu cu kết hp các thông tin tcác ngun dliu này. Các  
Grid Dliu có thể được sdụng trong lĩnh vực khai thác dliu(data mining) hoc các  
hthống thương mại thông minh. Trong trường hp này, không chcó hthng file hay  
các cơ sở dliu mà toàn bdliu ca tchc cn tp hp li. Ở đây có thphi kết  
hp gia Grid Dliu và Grid Tính toán.  
1.4.3. Scavenging Grid  
Một Scavenging Grid thường được dùng vi một lượng lớn các máy tính để bàn.  
Các máy tính thường được kiểm tra định kỳ để xem khi nào bxlý và các tài nguyên  
khác rnh rỗi để thc hin các tác vGrid. Chnhân của máy để bàn thường có quyn  
xác định khi nào thì chia schiếc máy ca mình.  
1.5. Kiến trúc Grid  
1.5.1. Bản chất Kiến trúc Grid  
Tchc ảo”(VO) là đơn vị cơ bản quan trng trong hthng Grid. Vic thiết lp,  
qun lý, khai thác, chia stài nguyên gia các tchc ảo đòi hi phi có kiến trúc hệ  
thng mi, kiến trúc Grid. Kiến trúc Grid dưới đây được xây dng da trên quan nim  
“để các VO hoạt động hiu quả đòi hỏi phi thiết lập được các quan hchia svi bt kỳ  
đơn vị tham gia tiềm năng nào”. Để làm được điều này, vấn đề “liên kết hoạt động”  
(interoperability) cn phải được tp trung gii quyết. Trong môi trường mạng, “liên kết  
hoạt động” đồng nghĩa với vic sdụng các protocol chung. Do đó, kiến trúc Grid slà  
kiến trúc protocol, vi các protocol xác định các cơ chế nn tảng để người dùng và nhà  
cung cp tài nguyên thương lượng, thiết lp, qun lý và khai thác các mi quan hchia sẻ  
tài nguyên.  
8
       
Kiến trúc Grid phi là kiến trúc da chuẩn, hướng mở, để dmrng, liên kết hot  
động tt, có tính khchuyn (portability) cao. Các protocol chun sẽ giúp định nghĩa các  
service chun, nhờ đó có thể xây dng các service cao cấp hơn một cách ddàng. Sau khi  
có được kiến trúc Grid, vic tiếp theo là xây dng các hàm API và các bộ SDK để cung  
cp các công ccn thiết để phát trin các ng dng chy trên nn Grid. Sở dĩ vấn đề  
“liên kết hoạt động” được xem là vấn đề cơ bản vì các mi quan hchia scó thphi  
được thiết lp gia các bên tham gia khác nhau vcác chính sách, giữa các môi trường  
khác nhau vnn tng, ngôn ngữ, môi trường lp trình,…Nếu không có nó, các thành  
viên trong VO sthc hin các chính sách chia sẻ song phương và không chắc rng các  
cơ chế sdng cho 2 thành viên này smrộng được cho các thành viên khác. Điều này  
khiến cho vic thành lập các VO động là không ththc hin hoặc cũng chỉ thành lp  
được VO theo mt kiểu nào đó mà thôi.  
Cũng giống như Web đã làm bùng nổ vic chia sthông tin bng cách cung cp  
các protocol và cú pháp chun (HTTP và HTML) dùng cho việc trao đổi thông tin, ở đây  
cũng cần các protocol và cú pháp chuẩn để chia stài nguyên. Để gii quyết vấn đề “liên  
kết hoạt động”, việc xây dng các protocol là quan trọng. Vì protocol xác định cách các  
thành phn phân tán trao đổi với nhau để đạt được mt mục đích nào đó, xác định các cu  
trúc thông tin cn thiết trong quá trình trao đổi. Các VO thường hay thay đổi, nên các cơ  
chế xác định, chia svà sdng tài nguyên cn phi mm do, gn nhẹ, để các tha thun  
chia stài nguyên có thể được thiết lập, thay đổi một cách nhanh chóng. Các cơ chế chia  
sẻ không được nh hưởng đến các chính sách cc b, và phi cho phép các thành viên  
quản lý được các tài nguyên ca họ. Vì các protocol quy định vic giao tiếp gia các  
thành viên chứ không quy định thành viên đó phải như thế nào, nên khi dùng các  
protocol, các chính sách cc bộ được gilại. Do đó các protocol được cần đến. Khi đã có  
các protocol, thì vic xây dng các service là cn thiết và quan trng, các service là bn  
cài đặt cthca các protocol. Vic xây dựng các service cơ bản phc vtruy cập đến tài  
nguyên tính toán, dliu, tìm kiếm tài nguyên, lp lch và đồng bhoá, sao chép dữ  
liệu,… cho phép xây dựng các service cao cấp hơn cho ứng dụng đồng thi trừu tượng  
hoá các chi tiết vtài nguyên. Cũng cần phi xây dng các bAPI và SDK, vì các nhà  
phát trin ng dng cn phi có công cụ để htrphát trin các ng dng phc tp trong  
môi trường Grid, người dùng cũng phải có khả năng thực thi được các ng dng này. Sc  
mnh, tính đúng đắn ca ng dng, chi phí phát trin và bo trì là nhng mi quan tâm  
9
quan trng. Các API và SDK có thể giúp tăng tốc vic phát trin mã, cho phép chia smã,  
tăng tính khả chuyn cho ng dng. Tt nhiên, API và SDK chhtrthêm chkhông  
ththay thế các protocol được.  
1.5.2. Chi tiết Kiến trúc Grid tổng quát  
Sau gần 10 năm tập trung nghiên cu, phát trin, tích lukinh nghim, các nhà  
phát trin công nghệ Grid đã có những thng nhất đáng kể vkiến trúc Grid. Mt trong  
nhng kiến trúc Grid được chp nhn nhiu nhất được đưa ra bởi Ian Foster,phần dưới  
đây sẽ gii thiu vkiến trúc này. Kiến trúc Grid, theo Ian Foster, là mt kiến trúc phân  
tầng như trong hình 1.1 . Các thành phn trong mt tầng có chung đặc điểm, tính cht, có  
thể được xây dng tbt ctầng dưới nào. Các thành phần được phân tng da theo vai  
trò ca chúng trong hthống Grid. Đây là một kiến trúc m.Kiến trúc này chỉ quy định  
các yêu cu chung nht vthiết kế và trin khai vi mục đích chính là để tham kho. Vic  
xây dựng, cài đặt cthtuthuc vào tng dán, từng lĩnh vực ng dng. Dưới đây là  
chi tiết ca kiến trúc:  
Application (ng dng)  
Collective (Tng kết hp)  
Resource (Tng tài nguyên)  
Connectivity (Tng kết ni)  
Fabric (Tng thiết b)  
Hình 1.1.Grid protocol Architecture  
1.5.2.1. Tng Fabric  
Đây là tầng thp nht ca kiến trúc, đại din cho các thiết bvt lý và toàn btài  
nguyên ca Grid mà các tchức, người dùng mun chia s, sdng. Các tài nguyên có  
thtn tại dưới dng vật lý như các máy tính, hệ thống lưu trữ, các danh mc, tài nguyên  
10  
   
mng, các loại sensor, cũng có thể là các thc thlogic - mt thc thtru tượng - đại  
din cho mt tp các tài nguyên vật lý, như hệ thng file phân tán, các cluster,… Trong  
trường hp các thc thlogic, vic trin khai có thể liên quan đến các protocol cc b(ví  
dcác protocol phc vdng truy cp NFS, hoc protocol qun lý tài nguyên, tiến trình  
trong cluster,…) nhưng các protocol này không liên  
quan đến kiến trúc Grid. Các thành phn ca tng Fabric thc hin các hoạt động cc bộ  
trên các tài nguyên cth(vt lý lẫn logic) như là bước tiếp sau ca các hoạt động chia sẻ  
tài nguyên ca các tầng trên. Do đó, có một mi liên hphthuc cht chgia các chc  
năng của tng Fabric vi các hoạt động chia sẻ được htr. Các chức năng ca tng  
Fabric càng mnh, càng nhiu scho phép các hoạt động chia sphc tp, phong phú  
hơn. Kinh nghiệm cho thy, vic qun lý tài nguyên tng này ít nht cũng phải có cơ  
chế cung cấp thông tin để xác được cu trúc, trạng thái, năng lực của tài nguyên và cơ chế  
điều khin chất lượng dch v.  
1.5.2.2. Tng Connectivity  
Tầng Connectivity định nghĩa các protocol liên lạc và chng thực cơ bản cn thiết  
cho các giao dch mng đặc trưng của Grid. Các protocol liên lc cho phép trao đổi dữ  
liu gia các tài nguyên tng Fabric. Các protocol chng thc xây dng trên các dch vụ  
liên lc nhm cung cp các cơ chế mã hóa, bo mt, xác minh và nhn dạng các người  
dùng và tài nguyên. Vic liên lạc đòi hỏi các công việc như vận chuyển, định tuyến, đặt  
tên. Trong tương lai, việc liên lc ca Grid có thcn các protocol mới, nhưng hiện nay  
nên xây dng trên các protocol có sn ca bTCP/IP protocol stack, cthlà các tng  
Network (IP và ICMP), Transport (TCP,UDP) và  
Application (DNS,OSPF,…).  
Vkhía cnh bo mt ca tng Connectivity, các gii pháp phi da trên các chun  
bo mt hin hành khi có thể. Cũng giống như liên lạc, rt nhiu chun bo mật đã được  
phát trin vi bInternet protocol có tháp dụng được.Vic chng thc, phân quyn  
trong môi trường Grid là rt phc tp. Các công nghbo mt truyn thng chyếu tp  
trung bo vcác giao dch gia các máy client và server. Trong Grid, vic phân bit  
client/server không tn ti, vì các mi tài nguyên trong một lúc nào đó có thể là server  
(khi nó nhn yêu cu), mt lúc khác lại là client (khi nó đề xut yêu cầu đến các tài  
11  
 
nguyên khác). Do đó, các giải pháp chng thực cho các môi trường VO nên đạt được các  
yêu cu vbo mt trong Grid như đã gii thiu.  
1.5.2.3. Tng Resource  
Tng Resource da trên các protocol liên lc và chng thc ca tng Connectivity  
để xây dng các protocol, API và SDK nhm htrviệc thương lượng, khi to, theo dõi,  
điều khin, tính toán chi phí và chi trcho các hoạt động chia strên tng tài nguyên  
riêng lmt cách an toàn. Bản cài đặt các protocol ca tng Resource sgi các chc  
năng của tầng Fabric để truy cập và điều khin các tài nguyên cc b.  
Các protocol tng Resource tp trung toàn bvào các tài nguyên riêng l, không quan tâm  
đến trng thái toàn cc và các hoạt đng trong các tp tài nguyên phân tán.  
Các protocol tầng Resource được phân thành 2 dạng chính như sau:  
- Các protocol thông tin  
Sdụng để thu thp thông tin vcu trúc và trng thái các tài nguyên ví dụ như  
cu hình hin ti, ti hin ti, chính sách sdụng,…  
- Các protocol qun lý  
Sdụng để thương lượng truy xuất đến mt tài nguyên chia sẻ, xác định rõ, ví d,  
các yêu cu vtài nguyên (bao gm luôn vic gichtài nguyên và chất lượng dch v)  
và các thao tác cần được thc hiện như tạo tiến trình, hoc truy xut dliu. Do các  
protocol qun lý chu trách nhiệm đại din cho các quan hchia sẻ, đảm bo các hot  
động sdng tài nguyên phi phù hp vi các chính sách chia stài nguyên, bao gm  
luôn vic tính toán và chi trchi phí. Mỗi protocol cũng nên hỗ trvic theo dõi trng  
thái và điều khin các hot động. Vi nhng yêu cầu như vậy, tp các protocol tng  
Resource (và Connectivity) nên nhgn và tp trung. Các protocol này chỉ nên đáp ứng  
được các cơ chế chia svi nhiu loi tài nguyên khác nhau (ví d, các hthng qun lý  
tài nguyên cc bộ khác nhau) là đủ. Các chức năng chính của tầng Resource cũng giống  
như của tng Fabric cng thêm nhiu ngnghĩa mới với cơ chế báo li tin cy khi hot  
động không thành công.  
12  
 
1.5.2.4. Tng Collective  
Trong khi tng Resource tập trung vào các tài nguyên đơn lẻ, tng Collective cha  
các protocol, service, API, SDK không liên hệ đến bt kmt tài nguyên cthnào mà  
thc hin qun lý toàn cc, tp trung vào các giao tác gia các tp tài nguyên. Tng  
Collective có thbsung thêm nhiu loi hoạt động chia smi ngoài những gì đã có từ  
tng Resource mà không cn bsung thêm các yêu cu mi cho các tài nguyên đang được  
chia s. Các chức năng của tng Collective có thể được cài đặt như các service (với các  
protocol tương ứng), hay như các bộ SDK(với các API tương ứng) được thiết kế để liên  
kết vi ng dng. Trong cả hai trường hợp, các cài đặt này có thể được xây dng trên các  
protocol và API ca tng Resource và Connectivity.  
1.5.2.5. Tng Application  
Tng trên cùng ca kiến trúc Grid bao gm các ng dng của người dùng chy  
trong một trường VO. Các ng dụng được xây dng theo cách sgi các dch vụ định  
nghĩa bởi các tầng phía dưới. Ví d: một chương trình phân tích bộ gen người cn phi  
chy hàng ngàn tác vụ độc lp, mi tác vcn nhiu file cha thông tin tng phn ca bộ  
gen có thsdng các chức năng Grid sau:  
- Ly các thông tin, thchng thc (các protocol tng Connectivity).  
- Truy vn hthng thông tin Grid và các danh mục để tìm các tài nguyên thích  
hp và vtrí các file dliệu đầu vào. (các dch vtng Collective).  
- Gi các yêu cầu đến các tài nguyên để thc hin tính toán, di chuyn dliệu,…  
và kim soát quá trình thc thi công việc, thông báo cho người dùng khi mi  
thhoàn tt, dò tìm và phn ng với các điều kin gây li (tng Resource).  
1.6. Grid computing đem lại nhng li ích gì ?  
1.6.1. Khai thác tối đa tài nguyên xử lý  
Li ích đầu tiên cần nói đến đó là khả năng chạy một chương trình trên nhiều máy  
tính khác nhau . Hay nói một cách khác ,đó là xử lý song song. Trong mt mạng lưới gm  
nhiu máy tính ,rất ít khi các máy tính đều được sdng mt cách tối đa những tài  
nguyên ca mình ,thường thì vi công việc văn phòng ,tính toán đơn giản ,máy tính chsử  
dng tối đa là 20% tài nguyên của máy, như vậy chúng ta nhìn thy luôn slãng phí ca  
nhng tài nguyên còn li. Triên khai hthng grid computing sgiúp tn dng nhng tài  
13  
       
nguyên còn chưa được sdụng kia để xlý một bài toán chung, trong trường hp này,  
tốc độ xử lý được tối ưu, sự lãng phí tài nguyên được gim ti mc tối đa.  
Không chthế ,grid computing cho phép o hóa những đĩa cứng còn trng thành  
một đĩa cứng mi , từ đây chúng ta có thể tn dụng tài nguyên lưu trdliu.  
1.6.2. Khả năng xử lý song song  
Khi kết hp nhiu bvi xử lý để gii quyết mt bài toán, chúng ta có thể hình tượng  
như sau, bài toán lớn được chia làm n phn cho n CPU xlý, mi mt CPU sxlý 1  
phần trong đó. Như vậy công việc chúng ta đạt được snhanh gp n ln.  
Nhưng không phải ng dụng nào cũng hợp lý nếu được trin khai mt cách song  
song. Công việc này đòi hoi người thiết ké ng dng phải tư duy và sáng tạo  
Tuy nhiên xlý song song slà một phương án cần nghĩ đến đầu tiên trong nghiên  
cu khoa hc ,gii quyết nhng bài toán lớn, có tính độc lp ca các thành phn cao.  
1.6.3. Chia sẽ tài nguyên ảo và tổ chức ảo  
Grid computing cho phép to ra một môi trường cng tác rng lớn ,đồng nht. Mi  
môi trường đó là một tchc o. Grid computing thm chí còn cho phép kết hp các tổ  
chc ảo, không đồng nht với nhau để cng tác vi nhau. Các tchc o này chia stài  
nguyên với nhau như là một mạng lưới ln.  
Chia stài nguyên dliu bng cách tri rộng cơ sở dliu trên nhiu hthng to  
nên dung lượng lớn hơn nhiều so vi hthống đơn. Cách trải rng dliệu này làm tăng  
tốc độ truyn dliu vi công nghstripping. Dliệu thường xuyên được sao lưu phục  
vcho vic khôi phc dliu.  
Ngoài ra ,còn có thchia snhiều tài nguyên khác như thiết bchuyên dng, phn  
mm.  
1.6.4. Sự truy cập đến các tài nguyên khác  
Ngoài CPI và tài nguyên lưu trữ, Grid còn có thtruy cập đến các tài nguyên khác.  
Các tài nguyên này có thể được cung cấp dưới dng số lượng hoc khả năng lưu trữ, băng  
thông. Ví d, nếu một người muốn tăng băng thông truy nhập Internet để thc hin vic  
khai thác dliu tìm kiếm, công vic này có thphân chia gia các máy trong mng Grid  
có đường truyn Internet không phthuộc vào nhau. Trong trường hp này, khả năng tìm  
14  
     
kiếm được nhân lên khi mỗi máy có đường truyn riêng bit. Nếu các máy chia sẻ đường  
kết ni internet thì nó sẽ không tăng băng thông.  
Trong mt mạng lưới, mt số máy tính được cài đặt nhưng phần mềm đắt tin, mt  
số khác thì không. Người sdng không cần cài đặt phn mềm đó vẫn có thsdng  
phn mm này bng cách gi công việc đến máy đã được cài phn mềm để yêu cu xlý.  
Đó là khả năng tn dng phn mm ca Grid.  
Mt vài máy in có thsdng nhng thiết bị đặc bit, chng hạn như máy in. Hầu  
hết các máy in được sdng txa. Grid có thchia sẻ được nhng thiết bị đặc bit này.  
Thm chí Grid còn có thchia snhng thiết b, tài nguyên phc tạp như máy chuẩn đoán  
bnh hay robot htrphu thut.  
1.6.5. Cân bằng tài nguyên  
Grid liên kết các tài nguyên tnhiu máy khác nhau to thành mt hthng duy  
nht. Grid có ththc hin cân bằng tài nguyên trong các chương trình bằng cách lp lch  
làm vic cho các công vic. Chức năng này có ý nghĩ to lớn trong vic xử lý các trường  
hp quá ti vxlý, tính toán trong mt tchc. Cân bng có thể được thc hin bi 2  
cách sau : nhng điểm quá tải được đưa đến nhng máy ri trên mạng lưới, nếu toàn  
mng Grid bn, nhng công việc có độ ưu tiên thấp được tạm ngưng để dành cho nhng  
công việc có độ ưu tiên cao hơn.  
Đôi khi có những công việc đột ngột được tăng độ ưu tiên do cần hoàn thành gp.  
Grid không thxử lý được nhng công vic cn hoàn thành quá gp. Tuy nhiên Grid có  
thxử lý được nhng công vic nhỏ và huy động mt lực lượng lớn tài nguyên để xlý  
nó mt cách nhanh nht.  
Mt li ích khác ca Grid là cân bng ti. Khi mt công vic liên lc vi mt công  
vic khác, vi Internet, hoc các tài nguyên khác, Grid có thlp lịch cho chúng để có thể  
gim thiu tối đa lưu lượng đường truyền cũng như khoảng cách truyền. Điều này giúp  
Grid có thgim thiu tc nghn mng.  
Cui cùng Grid còn có khả năng thương mại tài nguyên. Các trng thái ca tt cả  
các tài nguyên trong mạng được Grid qun lý. Các tchc trên Grid có thto tài khon  
và trtiền để sdng các tài nguyên này khi cn thiết. Điều này to nên tài chính mng  
lưới.  
15  
 
1.6.6. Độ tin cậy  
Trong tương lai, một mạng lưới có thcó khả năng thay thế mt hthống đáng tin  
cy. Grid mi chbắt đầu công nghnày. Mô hình máy chủ đáng tin cậy sdng Grid có  
thể được mô tả như sau. Một mạng lưới gm nhiều máy tính được phân bkhp nơi. Do  
đó, khi có một scti mt nt mạng nào đó trên mạng lưới, các điểm khác skhông bị  
ảnh hưởng. Khi mt máy tính bhng hóc, phn mm qun lý trong Grid tự động chuyn  
công vic xlý từ máy này đến một máy nào đó trong mạng. Trong trường hp quan  
trng, nhiu bn sao ca công việc được tạo ra và được chuyển đến nhiu máy khác nhau  
trên mạng lưới.  
16  
   
Chương 2: Globus Toolkit 4  
Globus Toolkit là mt btoolkit mã ngun mở được sdụng để xây dng các hệ  
thng và các ng dng Grid. Globus Toolkit hiện đang được phát trin bi tchc  
Globus Alliance và nhiu tchc khắp nơi trên thế gii. Globus Alliance là mt cng  
đồng và các cá nhân và tchc tham gia phát trin các công nghnn tng cho Grid.  
Globus Toolkit cho phép hin thc hóa các ý tưởng, mục tiêu đằng sau khái nim  
Grid. Btoolkit bao gm các dch vụ và thư viện phc vvic bo mt, htng thông tin  
Grid, qun lý tài nguyên, qun lý dliu, liên lc, phát hin lỗi,… Nó được đóng gói như  
mt tp các thành phn có thsdụng đc lp hoc kết hp vi nhau. Mi tchức đều có  
nhng hoạt động, chính sách khác nhau, vic kết hp, chia stài nguyên tnhiu tchc  
bcn trbởi tính không tương thích giữa các tài nguyên. Globus Toolkit được xây dng  
để loi bnhng trngi này. Các service, interface, và protocol của nó cho phép người  
dùng truy cập đến các tài nguyên ở xa như thể nó đang nằm trong máy tính ca htrong  
khi vn cho phép các tchc thiết lp chính sách cc bcủa mình như quản lý vic ai  
được dùng tài nguyên và khi nào…  
Mặc dù Globus được phát triển để phc vcác dán vkhoa hc và kthuật, nhưng hiện  
nay Globus cũng đã được áp dụng vào các lĩnh vực thương mại. Từ năm 2000, các công  
ty hàng đầu thế giới trong lĩnh vực công nghệ thông tin như Avaki, DataSynapse,  
Entropia, Fujitsu, Hewlett-packard, IBM, NEC, Oracle, Platform, Sun, Microsoft ,đã bắt  
đầu xây dng các chiến lược vGrid Computing trên nn tng Globus.  
2.1. Khái nim vGlobus  
The Globus Toolkit (GT) đã được phát trin tcui những năm 1990 đến nay  
nhm htrphát trin các dch vụ theo định hướng ng dng tính toán phân tán và cơ sở  
htng. Các thành phần cơ bản bao gm an ninh, truy cp tài nguyên, qun lý tài nguyên,  
di chuyn dliu, tìm kiếm tài nguyên, và v…. Những công cụ này đã lần lượt được sử  
dụng để mrng htầng cơ sca Grid và các ng dng phân tán.  
Globus được hiu theo những quan điểm như sau :  
17  
 
- Mt cộng đồng những người dùng và phát trin ,nhng cng tác viên bng cách  
sdng hoc phát trin nhng phn mm mã ngun m,liên kết các tài liu  
cho vic tính toán phân tán và liên kết tài nguyên.  
- Là phn mm GLOBUS TOOLKIT : mt tập các thư viện và chương trình cần  
thiết để xây dng mt hthng phân tán và các ng dụng được trin khai trên  
nó.  
- Mt nn tng htrcho cộng đồng : mã nguồn ,email … Tất cả đều có thể  
được gii quyết khi truy cp vào globus.org  
Globus toolkit cung cp rt nhiu thành phn ,bao gm :  
- Mt tp hp các dch vụ được thêm vào tp trung vào vic quản lý cơ sở hạ  
tng.  
- Các công cụ để xây dng nhng dch vWeb bng Java, C, Python.  
- Htng bo mt cao.  
- Là máy khách API hoc dòng lnh cho vic truy cp dch vvà tài nguyên.  
- Tài liệu đặc tvcác thành phn và cách dùng nó thế nào để xây dng mt ng  
dng.  
2.2. Nguyên nhân thúc đẩy sphát trin ca Globus  
Phn mềm Globus được thiết kế để cho phép các ng dng sdng ngun lc gia  
các tài nguyên phân tán cho dù đó là máy vi tính, thiết bị lưu trữ, dliu, dch v, mng  
lưới, hoc cm biến. Ban đầu, vic phát trin Globus được thúc đẩy bi nhu cu ca các  
"tchc o" trong khoa hc. Trong thi gian gần đây, vic sdng Globus trong các ng  
dụng thương mại đã trở nên ngày càng quan trng. Thương mại và khoa hc có cùng mt  
mi quan tâm là luôn luôn đỏi hi xlý dliệu thường xuyên, nhưng không phi là liên  
tc. Vic phát trin Globus bt ngun tnhu cu mun truy cp và xlý dliu hay nhân  
rng dliệu đó ra các máy tính khác nhau thuc các tchức khác nhau và đặt ti các vtrí  
địa lý cách xa nhau. Ví d:  
Mt nhà khoa hc (hoc mt nhà phân tích vkinh tế) cn truy cp dliu nm  
trong cơ sở dliu khác nhau trong mt mt tchc hp tác khoa hc (hoc doanh  
nghip).  
Mt doanh nghip cn phi phân bổ tính toán, lưu trữ, và tài nguyên mạng động để  
htrthời gian khác nhau thương mại điện t(hoc vt lý phân tích dliu  
18  
 
Mt kỹ sư có nhu cầu thiết kế và vn hành thnghim trên các thiết bị điều khin  
txa, liên kết và so sánh các sliu và mô phng vt lý.  
Một nhà thiên văn học cn nhân rng mt terabyte dliu một ngày đến các đối  
tác trên khp thế gii.  
2.3. Kiến trúc Globus  
2.3.1. Các thành phần thƣờng trực  
2.3.1.1. Java WS Core  
Bao gm các API và các công cthi hành chun WSRF và WS-Notification trên  
nn ngôn ngJava. Các thành phần đó trở thành nn tng cho mt scác dch vGrid.  
Ngoài ra, Java WS Core còn cung cấp các thư vin và công ccho vic phát trin các dch  
vWSRF  
2.3.1.2. C WS Core  
Bao gm các API và các công cthi hành chun WSRF trên nn ngôn ngC  
2.3.2. Các thành phn bo mt  
Trong GT, vic bo mật Grid được đảm trách bi module Grid Security  
Infrastructure (GSI). Như đã biết, yêu cu vbo mt, an toàn là mt trong nhng vấn đề  
chính trong các thiết kế Grid. Các thành phn bo mật cơ sở của GT đã đưa ra các cơ chế  
khá tốt để thc hin vic chng thc, phân quyn, bo mt liên lc gia các node trong  
Grid. GSI là mt smrng các protocol và API ca các chun vbo mt hin  
hành.GSI được xây dng trên các công ngh, các chuẩn như :  
Mô hình mã hoá khóa công khai (public key infrastructure(PKI))  
X.509 certificate  
Protocol Secure Sockets Layer (SSL)  
Tt ccác kết ni liên lạc trong Grid đều được mã hoá theo công nghệ  
RSA 1024 bit và truyn ti vi protocol SSL.  
Generic Security Service API (GSS-API)  
Toàn bphần cài đt của GSI đều tuân theo GSS-API (là mt bAPI  
chun dành cho các hthng bo mật được tchc Internet Engineering  
19  
         
Task Force (IETF) đưa ra).  
GSI đã mở rng các chuẩn này để cung cp thêm chức năng đăng nhập mt ln  
(single sign-on), y quyn (delegation), identity mapping (ánh xthc th).  
Proxy và y quyn  
(Phn mrng bi GSI, phc vsingle sign-on)  
PKI  
SSL/TSL  
(CA và Certificate)  
(Chng thc và bo vthông  
Hình 2.1. Tóm tt cu trúc và chức năng các thành phn ca GSI  
2.3.2.1. Cơ bn vbo mt Grid và GSI  
Symmetric Encryption  
Mã hoá kiu Symmetric da trên vic sdng mt khoá bí mật để thc hin mã hoá và  
gii mã dliệu. Để đảm bo dliu chỉ được đọc bi bên gi và bên nhận, khoá được  
trao đổi mt cách bí mt gia 2 bên. Nếu ai đó lấy được khóa bí mật đã sử dụng để mã  
hoá, hcó thgiải mã được thông tin. Phương pháp mã hoá này kém an toàn nhưng tốc  
độ mã hóa/gii mã li nhanh hơn dạng mã hoá Asymmetric trình bày dưới dây.  
Asymmetric Encryption  
Phương pháp này được gọi là phương pháp mã hoá khoá công khai, cũng được sử  
dng rất thường xuyên. Phương pháp này sử dng mt cặp khoá để mã hóa (được gi là  
khóa công khai (public key) và khóa bí mật (private key)). Khóa để mã hoá khác vi khoá  
được sdụng để giải mã. Phương pháp mã hoá khóa công khai yêu cu các bên phi bo  
vkcác khóa bí mt ca mình, trong khi khóa công khai ca hkhông cần được bo v,  
có thể được công brng rãi trong cộng đồng.Thông thường, khóa công khai được để  
20  
 
trong các chng chỉ điện t(digital certificate) được cp bởi Certificate Authority, nơi  
chu trách nhim qun lý các khóa công khai và người chcủa khóa công khai tương ứng.  
Hthng khoá công khai thc hin bo mt hai lần trên thông điệp trao đổi gia các bên.  
Trước hết, bên gi sẽ mã hóa thông điệp bng khóa bí mt ca mình, sau đó mã hoá tiếp  
ln na bng khóa công khai ca bên nhn. Khi nhận được thông điệp, bên nhn sthc  
hin gii mã bng khóa bí mt của mình trước, sau đó tiếp tc gii mã bng khóa công  
khai ca bên gi. Bng cách này, không ai khác có thể đọc được thông điệp trkhi có  
được khóa bí mt ca một bên, nhưng điều này rt khó thc hiện được vì hai bên gi và  
nhận không trao đổi khóa cho nhau, và khóa bí mật được giữ ở mi bên.Các thut toán  
phát sinh khóa bí mật và khóa công khai được thiết kế sao cho một thông điệp được mã  
hoá bi mt khoá thì chcó thể được gii mã bi khoá còn lại tương ứng, và không thể  
gii mã bởi khoá dùng để mã hoá. Các cặp khoá được phát sinh bng cách tìm 2 số  
nguyên tcc ln khác nhau. Ngay ckhi khóa công khai được để công khai rng rãi,  
cũng rất khó để các máy tính hin nay có thtìm ra khóa bí mt tkhóa công khai. Các  
thuật toán này tăng độ tin cy vbo mật nhưng li tn rt nhiu thời gian để mã hóa, đặc  
bit là khi phi mã hóa một lượng ln dliệu. Do đó, trong thực tế, người chdùng  
phương pháp public key encryption để trao đổi khóa của phương pháp symmetric  
encryption giữa hai bên, và sau đó, việc mã hoá/giải mã được sdng bng khoá  
symmetric này.  
Distinguished Name (DN)  
Distinguished Name là mt chui ký tduy nhất dùng để định danh người dùng  
(người dùng có thlà một người hay mt thc th) trong Grid, có thnói DN là mt  
“Grid username”. DN là một thành phn ca chng chỉ điện t. Phn ln thông tin trong  
DN là do CA cung cp.  
Digital certificates (Chng chỉ điện t)  
Chng chỉ điện tlà mt tài liệu điện tchứa thông tin định danh tài nguyên,  
người dùng Grid và khóa công khai tương ứng. Mt chng chỉ điện tlà mt cu trúc dữ  
liu cha khóa công khai và các thông tin chi tiết vchca khóa công khai đó. Một  
chng chỉ được xem như là một thnhn dạng điện tkhông thlàm giả sau khi đã được  
đóng dấu bởi CA trong môi trường Grid. Khi mt thc thtrong Grid mun bắt đầu mt  
phiên làm vic với đối tác nào đó, nó sẽ đính kèm chứng chỉ điện tca mình vào thông  
21  
điệp thay vì khóa công khai. Bên nhn kim tra chký ca CA trong chng chva nhn  
được. Nếu chữ ký đó là của mt CA mà bên nhận tin tưởng, thì nó có thchp nhn và tin  
tưởng rng khóa công khai trong chng chthc sự đến từ nơi gửi (thao tác này đề phòng  
trường hp giả danh người chcủa khóa công khai). Sau đó, bên nhận ssdng khóa  
công khai ca bên gửi để giải mã SSL session ID, SSL ID này dùng để mã hoá tt ccác  
dliu truyn thông gia 2 bên. Các chng chỉ điện tca GSI dựa định dng chng chỉ  
X.509, một định dng chun vchng chỉ điện tdo tchc Internet Engineering Task  
Force (IETF) đưa ra. Những chng chnày có thể dùng được vi các phn mm da trên  
PKI khác bao gm các trình duyt web ca Microsoft, Netscape. Có 2 loi chng chkhác  
nhau được dùng trong môi trường Grid.  
User certificate  
Một người dùng scn một user certificate để đại din cho mình, chng chnày  
xác định tên người dùng thc sca Grid chkhông phi tên mt server hay tên máy  
trm. Ví d, có một ai đó tên Bobby, thì trong chng chỉ điện tca anh ta có thcó mt  
distinguished name như sau:  
“/O=Grid/O=GridTest/OU=test.domain.com/CN=Bobby"  
Server certificate  
Nếu một người dùng mun chy các ng dng yêu cu chng thc trên server, sẽ  
cn phi có mt server certificate. Server certificate sghi fully-qualified domain name  
ca server vào user certificate của người đó.  
Để user certificate có hiu lc, full-qualified DNS name của người đó phi giống như  
trong user certificate. Ví d: nếu tên server là “Darksky”,tên trong server certificate có  
thlà :  
/CN=Service/Darksky.<domain>.<com>  
Certificate Authority (CA)  
Vic bo mật trong Grid được xác lp thông qua vic sdng các chng chỉ ở mc  
host và người dùng, các chng chỉ này sau đó được ánh xạ vào các người dùng cc bộ  
trên host. Để có được các chng chnày, các bn yêu cu xin cp chng chỉ được to ra,  
gửi đến mt CA tin cy, CA này sthc hin ký xác nhn vào chng chvà gi lại người  
yêu cu.  
22  
Các trách nhim chính ca mt CA bao gm :  
- Xác định được các thc thể đang yêu cầu cp chng ch.  
- Cp phát, loi bỏ và lưu trữ các chng ch.  
- Bo vcác CA server.  
- Qun lý không gian tên cho các chshu chng ch.  
- Theo dõi các hoạt động.  
Globus Toolkit có cung cp một module simple CA để phc vcho vic thử  
nghim các ng dng trong một trường Grid. Trong trừơng hợp này, simple CA kiêm  
luôn chức năng của CA và RA. Mt vấn đề then chốt trong môi trường PKI là đảm bo  
tính tin cy, có thể tin tưởng ca hthống. Trước khi mt CA có thể ký, đóng dấu và cp  
chng chcho  
các thc thể khác, nó cũng phải làm mt việc tương tự cho chính nó, để bn thân CA có  
thể được đại din bng chng chcủa mình. Điều đó có nghĩa CA cần phi làm các công  
vic sau:  
1. CA phát sinh ngu nhiên cp khóa cho nó.  
2. CA lưu trữ bo mt khóa bí mt ca nó.  
3. CA tto ra chng chcho chính mình.  
4. CA ký xác nhn chng chỉ đó bằng khóa bí mt ca mình.  
Gridmap File  
Sau khi đã có các chứng ch, mt thc thGrid cn phi biết người dùng nào có  
chng chỉ nào được phép truy cập đến các tài nguyên của nó. Điều này được thc hin  
bng mt file Grid map. File Grid map là một file trên tài nguyên đầu cui, thc hin ánh  
xạ các DN vào các người dùng cc btrên tài nguyên. Sau khi được ánh x, mt DN có  
thsdụng tài nguyên trên host như là một người dùng cc b, tc DN có toàn quyn ca  
người dùng cc bộ. Điều này cho phép phân cho các người dùng Grid khác nhau các  
quyn khác nhau trên tài nguyên thông qua các người dùng cc bộ được ánh xạ. Để từ  
chi truy cập đi vi mt DN, chcn loi bỏ DN đó ra khi Grid map file.  
Trong Globus Toolkit, trên hthng Linux, Grid map file được lưu trong file :  
/etc/grid-security/grid-mapfile. Grid-mapfile là mt file text, mi dòng là mt ánh xạ  
23  
gia DN và user cc b, có dạng như sau:  
“DN” <user cc b>  
Ví d: "/O=Grid/OU=GlobusTest/OU=simpleCA-b.ar.com/OU=ar.com/CN=Nguyen  
Thinh" thinh  
Các file quan trng  
Thư mục  
Tên file  
Din gii  
/etc/grid-sercurity  
Hostcert.pem  
Là server certificate được  
sdng trong mutual  
authentication  
Hostkey.pem  
Grid-mapfile  
Khóa bí mật tương ứng  
server certificate  
File ánh xgiữa tên người  
dùng  
Grid (subject hay DN) vi  
người  
dùng cc b.  
/etc/grid-sercurity/certificate  
$HOME$/.globus  
CA certificate  
Sa-signing-policy.conf  
Usercert.pem  
Certificate của người dùng  
(subject name,khóa công  
khai, chký ca  
CA)  
Userkry.pem  
Khóa bí mt ca user  
certificate (được mã hóa  
bng passphare).  
24  
Các công cliên quan  
Tên  
Tham số  
Din gii  
Grid-cert-request  
Sdụng để to mt cp khóa công  
khai/bímt và mt bn yêu cu cp chng  
chỉ trong thư mục ~/.globus/  
Grid-cert-info  
Grid-proxy-init  
-all -startdate  
-subject -  
Ly thông tin vchng ch. Ví d:  
$ Grid-cert-info subject  
enddate  
“/O=Grid/O=GridTest/OU=test.domain.com  
/CN=GreenStar  
-issuer -help  
-hours  
-bits  
Thc hin khi tạo proxy và đăng nhập vào  
Grid.  
-help  
Grid-proxydestroy  
Grid-proxy-info  
Logout khi Grid, thc hin hy proxy cc  
bộ. Lưu ý, các proxy ở xa không bhu.  
-subject -issuer  
-type -timeleft  
-strength -help  
Ly thông tin vproxy  
2.3.3. Các thành phần quản lý dữ liệu  
2.3.3.1. GridFTP  
Giao thức GridFTP đưa ra một cơ chế sdng cho mục đích truyền sliu an  
toàn, tin cậy, đạt hiu suất cao. Grid được sdng rng rãi trong các nhu cu truyn ti  
25  
   

Tải về để xem bản đầy đủ

pdf 69 trang yennguyen 18/05/2025 100
Bạn đang xem 30 trang mẫu của tài liệu "Khóa luận Giải hệ phương trình tuyến tính kích thước lớn trên nền tảng Grid Computing", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfkhoa_luan_giai_he_phuong_trinh_tuyen_tinh_kich_thuoc_lon_tre.pdf