Khóa luận Phát hiện mặt người trong ảnh và ứng dụng

ĐẠI HC CÔNG NGHỆ  
ĐẠI HC QUC GIA HÀ NI  
----W—X----  
Lê Mnh Tun  
PHÁT HIN MT NGƯỜI TRONG NH  
NG DNG  
KHÓA LUN TT NGHIP ĐẠI HC HCHÍNH QUY  
Ngành: Công NghThông Tin  
Hà Ni – 2009  
i
ĐẠI HC QUC GIA HÀ NI  
TRƯỜNG ĐẠI HC CÔNG NGHỆ  
Lê Mnh Tun  
PHÁT HIN MT NGƯỜI TRONG NH  
NG DNG  
KHOÁ LUN TT NGHIP ĐẠI HC HCHÍNH QUY  
Ngành: Công nghthông tin  
Cán bhướng dn: TS. Nguyn Hi Châu  
HÀ NI - 2009  
Li cm ơn  
Sau mt thi gian dài hc tp và nghiên cu, cui cùng em cũng đã hoàn thành  
khóa lun tt nghip này, đây là dp tt nht để em có thgi li cm ơn đến mi người.  
Em xin gi li cm ơn sâu sc đến Tiến sĩ Nguyn Hi Châu, đã tn hình hướng  
dn, định hướng cho em trong sut thi gian thc hin đề tài. Thy đã cho em nhng li  
khuyên quý báu giúp em hoàn thành tt khóa lun.  
Em xin cm ơn khoa Công NghThông Tin trường Đại Hc Công Ngh- Đại Hc  
Quc Gia Hà Ni, cm ơn các thy cô trong khoa đã tn tình ging dy, truyn đạt cho  
em nhng kiến thc quý báu trong nhng năm hc va qua, giúp cho em có mt nn tng  
kiến thc vng chc để thc hin khóa lun cũng như nghiên cu hc tp sau này.  
Tôi xin cm ơn tt cbn bè, anh, ch, nhng người đã giúp đỡ, khích lcũng như  
phê bình, góp ý, giúp tôi hoàn thành khóa lun mt cách tt nht.  
Cui cùng, con cm ơn b, m, nhng người luôn luôn quan tâm, chăm sóc cho con  
cvvt cht ln tinh thn, luôn to điu kin tt nht cho con có thchuyên tâm hc  
tp, nghiên cu. Gia đình luôn là ngun động viên, là chda tinh thn vng chc cho  
con.  
Hà ni, ngày 24 tháng 5 năm 2009  
Sinh viên  
Lê Mnh Tun  
iii  
TÓM TT  
Ngày nay các hthng nhn dng mt người đang được ng dng trong nhiu lĩnh  
vc, đặc bit là an ninh và bo mt. Nhn dng mt người tc là đưa ra nhng thông tin  
về đối tượng được đưa vào tmt bc nh, hay tcamera quan sát. Bước đầu tiên ca  
mt hthng nhn dng mt người là phát hin khuôn mt, tc xác định vtrí khuôn mt  
trên bc nh, sau đấy tách khuôn mt ra khi nh để tiến hành nhn dng.  
Trong khóa lun này em xin nêu mt trong nhng phương pháp để phát hin khuôn  
mt trong nh, sau đấy mrng ra vi phát hin mt người trong video và webcam.  
Sau khi đã xem xét các hướng tiếp cn khác nhau, em chn phương pháp tiếp cn  
hc máy bng Adaboost và mô hình Cascade of classifiers. Đim mnh ca Adaboost là  
tc độ phát hin khuôn mt khá nhanh. Kết quthnghim cho thy chương trình đạt độ  
chính xác khá cao vi các nh mt người được chp trc din bng máy kĩ thut s.  
iv  
MC LC  
TÓM TT............................................................................................................................iv  
MC LC............................................................................................................................v  
DANH SÁCH THUT NG............................................................................................vii  
DANH MC HÌNH V................................................................................................... viii  
DANH SÁCH TVIT TT ............................................................................................ix  
MỞ ĐẦU..............................................................................................................................1  
Chương 1 TNG QUAN VCÁC PHƯƠNG PHÁP XÁC ĐỊNH MT NGƯỜI ............3  
1. Gii thiu vbài toán xác định mt người trong nh................................................3  
2. Định nghĩa bài toán xác định mt người. ..................................................................3  
3. Nhng khó khăn và thách thc đối vi bài toán xác định mt người. ......................3  
4. Các ng dng ca xác định mt người......................................................................4  
4.1. Xác minh ti phm.................................................................................................4  
4.2. Camera chng trm................................................................................................4  
4.3. Bo mt. .................................................................................................................4  
4.4. Lưu trkhuôn mt .................................................................................................4  
4.5. Các ng dng khác ................................................................................................5  
5. Xác định phm vi đề tài.............................................................................................5  
Chương 2 CÁC CÔNG TRÌNH NGHIÊN CU ................................................................7  
1. Các phương pháp chính để xác định mt người........................................................7  
1.1. Hướng tiếp cn da trên tri thc...........................................................................8  
1.2. Hướng tiếp cn da trên đặc trưng không thay đổi.............................................10  
1.3. Hướng tiếp cn da trên so sánh khp mu. .......................................................13  
1.4. Hướng tiếp cn da trên din mo.......................................................................16  
Chương 3 CƠ SLÝ THUYT .......................................................................................23  
1. Tng quan vAdaboost...........................................................................................23  
1.1. Tiếp cn Boosting ................................................................................................23  
1.2. Adaboost ..............................................................................................................24  
1.3. Các đặc trưng Haar-Like......................................................................................28  
1.4. Cascade of Classifiers..........................................................................................31  
v
1.5. Cascade of boosting classifiers............................................................................33  
Chương 4 XÂY DNG NG DNG ..............................................................................34  
1. Sơ lược vOpenCV ................................................................................................34  
2. Tng quan vmt hthng phát hin mt người trong nh ...................................35  
3. Phân tích – thiết kế hthng phát hin mt người..................................................35  
3.1. Phân tích...............................................................................................................35  
3.2. Thiết kế hthng .................................................................................................36  
3.3. Thiết kế cơ sdliu...........................................................................................38  
3.4. Thiết kế giao din.................................................................................................39  
KT LUN VÀ HƯỚNG PHÁT TRIN..........................................................................41  
vi  
DANH SÁCH THUT NGỮ  
Thut ngữ  
Gii thích  
Classifier  
Mt bphân loi được xây dng theo mt thut toán hc máy  
nào đấy, dùng để phân loi các đối tượng (khuôn mt hay  
không phi khuôn mt)  
(bphân loi)  
False alarm  
Feature  
Là tlnhn dng sai ca các bphân loi  
Các thông tin giúp nhn biết đối tượng.  
(đặc trưng)  
Haar-like feature Các đặc trưng ca đối tượng trong nh. Các đặc trưng này  
thường được định nghĩa bng các tính toán vi tng đim nh  
ca mt vùng nào đó trên bc nh.  
Hit rate  
Là tlnhn dng đúng ca bphân loi  
Max false alarm  
Đạt được tlsai này thì bphân loi được xây dng thành  
công, tlsai này là mt giá trbé, có thchp nhn được  
trong bài toán phân loi.  
Strong classifier  
Bphân loi được xây dng tnhiu bphân loi yếu, có độ  
(bphân loi mnh) chính xác cao.  
Threshold  
Ngưỡng là giá trranh gii gia các lp, giá trca ngưỡng  
(ngưỡng)  
có thể điu chnh được thường được chn tthc nghim.  
(Người ta thbnhn dng vi các giá trngưỡng khác nhau  
để chn ra ngưỡng cho tlnhn dng đúng tt nht)  
Bphân loi đơn gin có độ chính xác khong 50%.  
Weak classifier  
(bphân loi yếu)  
vii  
DANH MC HÌNH VẼ  
Hình 1: Mt phương pháp xác định khuôn mt đin theo hướng tiếp cn top-down. .........8  
Hình 2: Phương pháp chiếu................................................................................................10  
Hình 3: Mt mu khuôn mt ..............................................................................................15  
Hình 4: các vector quan sát để hun luyn cho HMM.......................................................20  
Hình 5: Các trng thái n....................................................................................................21  
Hình 6: Xác định khuôn mt bng HMM...........................................................................21  
Hình 7: Boosting.................................................................................................................24  
Hình 8 : 4 đặt trưng Haar-like cơ bn.................................................................................28  
Hình 9: Các đặc trưng mrng ca các đặc trưng Haar-like cơ s...................................29  
Hình 10: Cách tính Integral Image ca nh........................................................................30  
Hình 11:Ví dcách tính nhanh tng các đim nh ca vùng D trên nh...........................30  
Hình 12: Ví dcách tính nhanh tng đim nh ca vùng D trên nh vi các đặc trưng  
xoay 45o ..............................................................................................................................30  
Hình 13: cascade of classifiers ...........................................................................................32  
Hình 14: Cascade of boosting classifiers............................................................................33  
Hình 15: Cu trúc cơ bn ca OpenCV..............................................................................34  
Hình 16: Tng quan vhthng phát hin mt người trong nh.......................................35  
Hình 17: Biu đồ ngcnh ca hthng ...........................................................................36  
Hình 18: Biu đồ phân rã chc năng..................................................................................38  
Hình 19: Sơ đồ thc thquan h( ERM )..........................................................................39  
Hình 20: Giao din ca chương trình .................................................................................40  
viii  
DANH SÁCH TVIT TT  
STT  
Kí hiu  
CSDL  
HMM  
ML  
Ttiếng anh  
Ý nghĩa  
1
2
3
4
5
6
Database  
Cơ sdliu  
Hidden Markov Model  
Maximum-Likelihood  
Mô hình Markov n  
Phương thc cc đại khnăng  
PCA  
Principal Component Analysis Phân tích thành phn chính  
PDF  
Probility Density  
Hàm mt độ xác xut  
RSAT  
Rotated Summed Area Table  
Mng hai chiu dùng để tính  
nhanh các đặc trưng xoay 45o  
Mng hai chiu dùng để tính  
nhanh các đặc trưng haar-like cơ  
bn  
7
SAT  
Summed Area Table  
ix  
MỞ ĐẦU  
Công nghthông tin đang được ng dng trong mi lĩnh vc ca cuc sng. Vi  
mt hthng máy tính, chúng ta có thlàm được rt nhiu vic, tiết kin thi gian và  
công sc. Đin hình như công vic nhn dng mt người. Ngày xưa, mun tìm kiếm mt  
ktình nghi trong siêu thhay sân bay, các nhân viên an ninh phi tìm kiếm trên tng màn  
hình camera theo dõi. Ngày nay, công vic đấy đã được làm tự động nhcác hthng  
nhn dng mt người. Phát hin mt người trong nh là mt phn quan trng ca hthng  
nhn dng mt người đó, gii quyết tt vic phát hiên mt người sgiúp tiết kim thi  
gian và nâng cao độ chính xác ca vic nhn dng khuôn mt.  
Phát hin mt người cũng là mt bài toán nhn dng đơn gin, hthng chcn phân  
loi đối tượng đưa vào có phi mt người hay không phi mt người. mc độ cao hơn,  
sau khi đã phát hin được khuôn mt, các khuôn mt đó sẽ được so sánh vi các khuôn  
mt có trong dliu để nhn dng xem khuôn mt đấy là ca ai (thường áp dng trong  
nhn dng khuôn mt ca người ni tiếng hoc ca ti phm đang btruy nã).  
Bài toán phát hin mt người được bt đầu nghiên cu tnhng năm 1990s, và đã  
có rt nhiu công trình nghiên cu vphát hin khuôn mt trong nh, tuy nhiên cho đến  
nay, các nhà khoa hc vn không ngng tìm các hướng tiếp cn mi, các thut toán mi  
nhm nâng cao hiu sut ca vic phát hin khuôn mt cũng như vic nhn dng mt  
người.  
Vi mc tiêu chính là tìm hiu gii thut adaboost, các đặc trưng haar-like, mô hình  
Cascade of Classifiers, đồng thi áp dng vào bài toán phát hin mt người trong nh,  
khóa luân được trình by trong bn chương vi bcc như sau:  
Chương 1: Tng quan vcác phương pháp xác định mt người : Gii thiu tng  
quan vbài toán xác định mt người trong nh, các ng dng và nhng khó khăn ca bài  
toán, đồng thi xác định phm vi ca đề tài.  
Chương 2: Các công trình nghiên cu : Nêu chi tiết bài toán phát hin mt người,  
các hướng tiếp cn gii quyết bài toán, các nghiên cu và thành quả đạt được ca các nhà  
nghiên cu trong bài toán xác định mt người.  
1
Chương 3: Cơ slý thuyết : Đi sâu vào hướng tiếp cn da theo thut toán hc  
máy adaboost. Gii thiu vcác đặc trưng haar-like ca khuôn mt, cách tính các đặc  
trưng haar-like. Tiếp theo là gii thiu vmô hình cascade of classifiers và cách áp dng  
vào bài toán phát hin mt người trong nh.  
Chương 4: Xây dng ng dng : Xây dng mt chương trình demo vphát hin  
mt người trong nh. Nêu lên các phân tích – thiết kế vchương trình.  
Cui cùng là kết lun và hướng phát trin: Tóm tt nhng kết quả đạt được,  
nhng hn chế và nêu lên các hướng phát trin trong tương lai.  
2
Chương 1  
TNG QUAN VCÁC PHƯƠNG PHÁP  
XÁC ĐỊNH MT NGƯỜI  
1. Gii thiu vbài toán xác định mt người trong nh.  
Trong nhiu năm qua, có rt nhiu công trình nghiên cu vbài toán nhn dng mt  
người. Các nghiên cu đi tbài toán đơn gin, tvic nhn dng mt mt người trong  
nh đen trng cho đến mrng cho nh mu và có nhiu mt người trong nh. Đến nay  
các bài toán xác định mt người đã mrng vi nhiu min nghiên cu như nhn dng  
khuôn mt, định vkhuôn mt, theo dõi mt người hay nhn dng cm xúc mt người…  
Phát hin mt người trong nh là phn đầu tiên ca mt hthng nhn dng mt  
người. Các hthng nhn dng khuôn mt được bt đầu xây dng tnhng năm 1970,  
tuy nhiên do còn hn chế vcác lut xác định mt người nên chỉ được áp dng trong mt  
số ứng dng như nhn dng thcăn cước. Nó chỉ được phát trin mnh mtnhng năm  
1990 khi có nhng tiến btrong công nghvideo và ngày nay thì các ng dng ca xác  
định mt người đã trnên phbiến trong cuc sng.  
2. Định nghĩa bài toán xác định mt người.  
Xác định khuôn mt người là mt kthut máy tính để xác định các vtrí và kích  
thước ca các khuôn mt người trong các nh bt kì. Kthut này nhn biết các đặc trưng  
ca khuôn mt và bqua nhng thkhác như: tòa nhà, cây ci, cơ th…  
3. Nhng khó khăn và thách thc đối vi bài toán xác định mt người.  
Vic xác định khuôn mt người có nhng khó khăn nht định như:  
Hướng ca khuôn mt đối vi máy nh, như: nhìn thng, nhìn nghiêng hay nhìn  
ttrên xung. Cùng trong mt nh có thcó nhiu khuôn mt nhng tư thế  
khác nhau.  
Scó mt ca các chi tiết không phi là đặc trưng riêng ca khuôn mt người,  
như: râu quai nón, mt kính, ….  
Các nét mt khác nhau trên khuôn mt, như: vui, bun, ngc nhiên, ….  
Mt người bche khut bi các đối tượng khác có trong nh.  
3
Sbiu cm ca khuôn mt : sbiu cm có thlàm thay đổi đáng kcác đặc  
trưng và thông sca khuôn mt, ví dnhư khuôn mt ca cùng mt người sẽ  
rt khác khi người đấy cười, tc gin hay shãi …  
4. Các ng dng ca xác định mt người.  
Xác định mt người thường là mt phn ca mt hthng (facial recognition  
system). Nó thường được dùng trong giám sát video, giao tiếp người máy và qun lý cơ  
sdliu nh… Các ng cơ bn ca xác định mt người có thkể đến là:  
4.1.Xác minh ti phm.  
Da vào nh ca mt người, nhn dng xem người đấy có phi là ti phm hay  
không bng cách so sách vi các nh ti phm đang được lưu tr. Hoc có thsdng  
camera để phát hin ti phm trong đám đông. ng dng này giúp cơ quan an ninh qun  
lý con người tt hơn.  
4.2.Camera chng trm.  
Các hthng camera sxác định đâu là con người và theo dõi xem con người đó có  
làm gì phm pháp không, ví dnhư ly trm đồ, xâm nhp bt hp pháp vào mt khu vc  
nào đó.  
4.3.Bo mt.  
Các ng dng vbo mt rt đa dng, mt trong số đó là công nghnhn dng mt  
người ca laptop, công nghnày cho phép chnhân ca máy tính chcn ngi trước máy  
là có thể đăng nhp được. Để sdng công nghnày, người dùng phi sdng mt  
webcam để chp nh khuôn mt ca mình và cho máy “hc” thuc các đặc đim ca  
khuôn mt giúp cho quá trình đăng nhp sau này.  
4.4.Lưu trkhuôn mt  
Xác định mt người có thể được ng dng trong các trm rút tin tự động (ATM) để  
lưu trkhuôn mt ca người rút tin. Hin nay có nhng người bngười khác ly trm thẻ  
ATM và mã PIN, và brút tin trm, hoc có nhng chtài khon đi rút tin nhưng li  
báo vi ngân hàng là bmt thvà brút tin trm. Nếu lưu trữ được khuôn mt ca  
người rút tin, ngân hàng có thể đối chng và xlý ddàng hơn.  
4
4.5. Các ng dng khác  
Điu khin vào ra: văn phòng, công ty, trs, máy tính, Palm, …. Kết hp thêm  
vân tay và mng mt. Cho phép nhân viên được ra vào nơi cn thiết.  
An ninh sân bay, xut nhp cnh (hin nay cơ quan xut nhp cnh Mỹ đã áp  
dng). Dùng camera quan sát để xác thc người nhp cnh và kim tra xem người  
đấy có phi là ti phm hay phn tkhng bkhông.  
Tìm kiếm và tchc dliu liên quan đến con người thông qua khuôn mt người  
trên nhiu hcơ sdliu lưu trtht ln, như internet, các hãng truyn hình, ….  
Ví d: tìm các đon video có tng thng Bush phát biu, tìm các phim có din viên  
Tăng Thanh Hà đóng, tìm các trn đá bóng có Công Vinh đá, …  
Kim tra trng thái người lái xe có nggt, mt tp trung hay không, và htrợ  
thông báo khi cn thiết.  
Tương lai sphát trin các loi ththông minh có tích hp sn đặc trưng ca  
người dùng trên đó, khi bt cngười dùng khác dùng để truy cp hay xlý ti các  
hthng sẽ được yêu cu kim tra các đặc trưng khuôn mt so vi thẻ để biết nay  
có phi là chthhay không.  
Hãng máy chp hình Canon đã ng dng bài toán xác định khuôn mt người vào  
máy chp hình thế hmi để cho kết quhình nh đẹp hơn, nht là khuôn mt  
người.  
5. Xác định phm vi đề tài  
Trong đề tài này, tôi tp trung vào vic xác định khuôn mt trong nh, video hoc  
webcam. Từ đấy lưu khuôn mt tìm được vào CSDL để phc vcho các mc đích khác (  
chng hn như nhn dng mt người hoc ghép khuôn mt vào bc nh khác … ). Do các  
điu kin khó khăn đã nêu trên ( mc 3 chương 1) tôi xin đưa ra nhng giả định và rành  
buc sau để gim độ phc tp ca bài toán:  
Các khuôn mt được chp thng hoc góc nghiêng không đáng k(bé hơn 10o)  
Phông nn ca nh không quá phc tp  
nh được chp trong điu kin ánh sáng bình thường.  
5
Đối vi video hoc webcam, do có thtách thành các xlý trên nh nên vi  
nhng video phc tp hay webcam quá kém, chương trình skhông thc hin  
được tt nht có th.  
6
Chương 2  
CÁC CÔNG TRÌNH NGHIÊN CU  
1. Các phương pháp chính để xác định mt người.  
Da vào tính cht ca các phương pháp xác định mt người trên nh, các phương  
pháp này được chia thành bn loi chính, tương ng vi bn hướng tiếp cn khác nhau.  
Ngoài ra cũng có rt nhiu nghiên cu mà phương pháp xác định mt người không chỉ  
da vào mt hướng mà có liên quan đến nhiu hướng.  
Hướng tiếp cn da trên tri thc: Da vào các thut toán, mã hóa các đặc trưng và  
quan hgia các đặc trưng ca khuôn mt thành các lut. Đây là hướng tiếp cn  
theo kiu top-down.  
Hướng tiếp cn da trên đặc trưng không thay đổi: Xây dng các thut toán để tìm  
các đặc trưng ca khuôn mt mà các đặc trưng này không thay đổi khi tư thế  
khuôn mt hay vtrí đặt camera thay đổi. Hướng tiếp cn này là hướng tiếp cn  
theo kiu bottom-up.  
Hướng tiếp cn da trên so sánh khp mu: Dùng các mu chun ca khuôn mt  
(các mu này được định nghĩa bng tay trước hoc được tham shóa bng mộ  
hàm s) để mô tcác khuôn mt hay các đặc trưng ca khuôn mt. Mu này được  
sdng để phát hin khuôn mt bng cách quét nó qua nh và tính toán giá trị  
tương đồng cho mi vtrí. Vic xut hin mt khuôn mt ti mt vtrí nào đó  
trong nh phthuc vào giá trtương đồng ca đim đó so vi mu chun  
Hướng tiếp cn da trên din mo: Trái ngược vi hướng tiếp cn da trên khuôn  
mu, các mô hình (hay các mu) sẽ được hc tmt tp nh hun luyn mà thể  
hin tính cht tiêu biu ca sxut hin ca mt người trong nh. Sau đó hệ  
thng (mô hình) sxác định mt người. Phương pháp này còn được biết đến vi  
tên gi tiếp cn theo các phương pháp hc máy.  
7
1.1. Hướng tiếp cn da trên tri thc  
1.1.1. Tư tưởng  
Trong hướng tiếp cn này, các phương pháp xác định mt người được xây dng da  
vào các lut, các lut này phthuc vào tri thc ca các tác ginghiên cu vbài toán  
xác định khuôn mt. Ddàng xây dng các lut cơ bn để mô tcác đặc trưng ca khuôn  
mt và các quan htương ng. Ví d, mt khuôn mt thường có hai mt đối xng qua  
trc thng đứng gia khuôn mt và có mt mũi mt ming. Các quan hệ đặc trưng có thể  
là quan hvvtrí và khong cách tương đối. Khó khăn ca hướng tiếp cn này đó là làm  
thế nào để chuyn các tri thc ca con người vkhuôn mt sang các lut cho máy tính  
mt cách hiu qu. Nếu các lut này quá chi tiết, cht chthì scó thxác định thiếu các  
khuôn mt có trong nh, nhưng nếu các lut quá tng quát thì sdn đến xác định sai khu  
vc không phi là khuôn mt thành khuôn mt. Ngoài ra cũng khó để mrng phm vi  
ca bi toán để xác định các khuôn mt có nhiu tư thế khác nhau.  
1.1.2. Các nghiên cu  
Có nhiu cách để xây dng chương trình xác định mt người theo hướng tiếp cn  
da trên tri thc. Thông thường chương trình sẽ được xây dng theo hướng da vào mt  
phương pháp nào đấy chn ra các ng viên trong bc nh trước, sau đó sáp dng các  
lut để xác định ng viên nào là khuôn mt, ng viên nào không phi là khuôn mt. Quá  
trình này có thể được áp dng nhiu ln để gim sai sót.  
Hình 1: Mt phương pháp xác định khuôn mt đin theo hướng tiếp cn top-down.  
Trên hình 1, Các lut được xây dng da vào tri thc ca người nghiên cu vcác  
đặc trưng ca khuôn mt (ví dnhư cường độ phân phôi và skhác nhau ) ca các vùng  
trên khuôn mt  
8
Yang và Huang đã sdng hướng tiếp cn da trên tri thc để xác định khuôn mt  
[7]. Hthng ca hai tác gibao gm ba mc lut. Đầu tiên các ông sdng mt khung  
ca sổ để quét trên bc nh và thông qua mt stp lut để xác định các ng viên có thể  
là mt người, ví dnhư tìm phn trung tâm ca khuôn mt (phn ti hơn trong hình 1).  
Tiếp theo, dùng mt tp lut để mô ttng quát hình dáng khuôn mt, lc các ng viên ở  
mc mt thành mt tp các ng viên mi có xác xut là khuôn mt cao hơn. Cui cùng,  
các ông li dùng mt tp lut khác để xem xét mc chi tiết các đặc trưng khuôn mt ( có  
thđặc trưng vmt, mũi, ming … ), từ đó lc ra các ng viên chính xác nht. Có thể  
nói cách làm ca hai ông là mt cách làm mn dn để đạt được kết qutt nht, mc dù tỷ  
lchính xác chưa cao, nhưng đây là tin đề cho nhiu nghiên cu sau này.  
Có rt nhiu công trình nghiên cu sdng phương pháp chiếu để xác định khuôn  
mt. Kotropoulos và Pitas đưa ra mt phương pháp gn tương tvi Yang và Huang. Đầu  
tiên, các vùng ca khuôn mt được định vbi phương pháp chiếu (đã được Kanade sử  
dng thành công) để xác định biên ca khuôn mt. Vi I(x,y) là giá trxám ca mt đim  
trong nh có kích thước m x n ti vtrí (x,y), các hàm để chiếu nh theo phương ngang  
và thng đứng được định nghĩa như sau:  
Da trên biu đồ hình chiếu ngang, khi xét biu đồ biến thiên ca HI hai ông tìm  
được hai cc tiu địa phương tương ng vi hai đỉnh đầu bên trái và bên phi ca khuôn  
mt. Còn theo hình chiếu dc, xét biến thiên và tìm cc tiu địa phương ca VI cũng cho  
ta các vtrí ca ming, đỉnh mũi và hai mt. Các đặc trưng này đủ để xác định khuôn mt.  
Hình 2.a cho mt ví dvcách xác định như trên. Cách xác định này có tlxác định  
chính xác là 86.5% cho trường hp chcó mt khuôn mt trc din và hình nn không  
phc tp. Nếu hình nn phc tp như hình 2.b thì rt khó tìm. Còn nếu nh có nhiu  
khuôn mt (hình 2.c) thì skhông xác định được.  
9
Hình 2: Phương pháp chiếu  
(a) nh chcó mt khuôn mt và hình nn đơn gin;  
(b) nh chcó mt khuôn mt và hình nn phc tp;  
(c) nh có nhiu khuôn mt  
1.2. Hướng tiếp cn da trên đặc trưng không thay đổi.  
Tiếp cn da trên các đặc trưng không thay đổi là tiếp cn theo kiu bottom up. Da  
trên thc tế, chúng ta cgng tìm ra nhng đặc đim không thay đổi khi ca khuôn mt  
khi các tư thế khác nhau và các điu kin môi trường như ánh sáng khác nhau. Đã có rt  
nhiu nghiên cu vhướng tiếp cn này, các đặc đim không thay đổi được tìm thy như  
lông mày, mt, mũi, ming hay các đường vin trên tóc … Trên cơ scác đặc trưng này,  
các nhà nghiên cu xây dng lên mt mô hình thng kê mô tquan hca các đặc trưng  
và từ đó xác định sxut hin ca khuôn mt trong bc nh. Khó khăn ca hướng tiếp  
cn này đó là phi mô tcác đặc trưng không thay đổi và quan hgia chúng phù hp vi  
điu kin ánh sáng, độ nhiu hay bche khut.  
1.2.1. Các đặc trưng ca khuôn mt  
Có rt nhiu nghiên cu vcác đặc trưng ca khuôn mt. Có thda vào các đặc  
trưng như hai mt, hai lmũi, ming, phn ni gia mũi và ming … hoc da vào đường  
vin ca khuôn mt.  
Leung đã đưa ra mt mô hình xác xut để xác định khuôn mt trong nh có hình nn  
phc tp da trên vic tìm kiếm các đặc trưng không thay đổi ca khuôn mt trong nh,  
sau đó dùng đồ thngu nhiên để xác định khuôn mt. Tư tưởng ca phương pháp này đó  
là xem bài toán xác định khuôn mt như là bài toán tìm kiếm vi mc tiêu là tìm thtự  
các đặc trưng không thay đổi ca khuôn mt. Dùng năm đặc trưng (hai mt, hai lmũi,  
phn ni gia mũi và ming) để mô tmt khuôn mt. Đồng thi tính quan hkhong  
cách cho tt ccác cp đặc trưng (như mt trái, mt phi), sau đấy dùng phân bGauss để  
10  
mô hình hóa. Mt mu khuôn mt được đưa ra thông qua trung bình tương ng cho mt  
tp đa hướng, đa tlca blc đạo hàm Gauss. Tmt nh, các đặc trưng ca ng viên  
được xác định bng cách so khp tng đim nh khi lc tương ng vi vector mu. Hai  
ng viên có đặc trưng đứng đầu sẽ được chn để tìm kiếm cho các đặc trưng khác ca  
khuôn mt. Tcác đặc trưng không thay đổi, các đặc trưng khác sẽ được xác định thông  
qua sự đánh giá xác xut khong cách gia các đặc trưng, hơn na phương sai ca phép  
thng kê này có thể được tính toán trước để xác định các đặc trưng vi xác xut ln. Tlệ  
chính xác ca phương pháp này là 86%.  
Bên cnh tính khong cách liên quan để mô tquan hgia các đặc trưng như  
Leung. Kendall [4], Mardia and Dryden [12] dùng lý thuyết xác sut thng kê vhình  
dáng. Dùng hàm mt độ xác sut (Probility Density Function - PDF) qua N đim đặc  
trưng, tương ng (xi, yi) là đặc trưng thi vi gislà phân bGauss có 2N-chiu. Các  
tác giáp dng phương thc cc đại khnăng (Maximum-Likelihood - ML) để xác định  
vtrí khuôn mt. Mt thun li ca phương pháp này là các khuôn mt bche khut vn  
có thxác định được. Hn chế phương pháp này đó là không xác định được nhiu khuôn  
mt trong cùng mt nh.  
Không dùng phương pháp xác xut, Sirohey đưa mt phương pháp khác xác định  
khuôn mt tmt nh có hình nn phc tp [10], gi là phương pháp da trên cnh. Ông  
dùng phương pháp Candy [9] và heuristics loi bcác cnh để còn li duy nht mt  
đường bao xung quanh khuôn mt. Dùng mt hình ellipse để bao khuôn mt, tách bit  
vùng đầu và hình nn. Tlchính xác ca thut toán là 80%.  
Graf đưa ra mt phương pháp khác để xác định đặc trưng, từ đó xác định khuôn mt  
trong nh xám [8]. Dùng blc để làm ni các biên, các phép toán hình thái hc  
(morphology) được dùng để làm ni bt các vùng có cường độ cao và hình dáng chc  
chn (như mt). Thông qua histogram để tìm các đỉnh ni bt để xác định các ngưỡng  
chuyn nh xám thành hai nh nhphân. Tiếp theo, ông xác định các ng viên khuôn mt  
nhvào các thành phn đều xut hin trong chai nh nhphân, sau đó phân loi xem các  
ng viên có phi là khuôn mt không. Phương pháp được kim tra và cho kết qutt trên  
các nh chđầu và vai ca người. Tuy nhiên phương pháp này còn mt vn đề đấy là  
sdng các phép toán morphology như thế nào và làm sao xác định khuôn mt trên các  
vùng ng viên.  
11  
Park dùng Gaze để tìm ng viên góc mt, ming và tâm mt. Ông xây dng SVM  
(Support Vector Machine) đã được hc trước đó để xác định các vtrí ng viên có phi là  
góc mt, ming, và tâm mt hay không để theo vết con mt người.  
Juan và Narciso xây dng mt không gian màu mi YCg’Cr’ để lc các vùng là ng  
viên khuôn mt da trên sc thái ca màu da người. Sau khi có ng viên, hai ông dùng  
các quan hvhình dáng khuôn mt, mc độ cân đối ca các thành phn khuôn mt để  
xác định khuôn mt người. Tương t, Chang và Hwang cũng dùng không gian mu  
Ycg’Cr’ vi tlchính xác hơn 80% trong nh xám.  
Jin xây dng mt blc để xác định ng viên khuôn mt người theo màu da người.  
Từ ứng viên này tác gixác định khuôn mt người theo hình dáng khuôn mt và các quan  
hệ đặc trưng vthành phn khuôn mt, vi mt phi được chn làm gc ta độ để xét  
quan h. Tlchính xác cho khuôn mt chp thng trên 80%.  
1.2.2. Kết cu ca khuôn mt.  
Khuôn mt con người có nhng kết cu riêng bit mà có thdùng để phân loi so  
vi các đối tượng khác. Tkết cu ca khuôn mt xây dng lên mt bphân loi, gi là  
kết cu ging khuôn mt (face-like texture).  
1.2.3. Mu sc da.  
Thông thường các nh màu không xác định trc tiếp trên toàn bdliu nh mà các  
tác gidùng tính cht sc màu ca da người (khuôn mt người) để chn ra được các ng  
viên có thlà khuôn mt người (lúc này dliu đã thu hp đáng k) để xác định khuôn  
mt người.  
1.2.4. Đa đặc trưng.  
Gn đây có nhiu nghiên cu sdng các đặc trưng toàn cc như: màu da người,  
kích thước, và hình dáng để tìm các ng viên khuôn mt, ri sau đó sxác định ng viên  
nào là khuôn mt thông qua dùng các đặc trưng cc b(chi tiết) như: mt, lông mày, mũi,  
ming, và tóc. Tùy mi tác gissdng tp đặc trưng khác nhau.  
12  
1.3. Hướng tiếp cn da trên so sánh khp mu.  
1.3.1. Tư tưởng ca so sánh khp mu  
Trong hướng tiếp cn da trên so sánh khp mu, các mu chun ca khuôn mt  
(thường là khuôn mt được chp thng) sẽ được xác định trước hoc được biu din thành  
mt hàm vi các tham scth. Từ ảnh đầu vào, ta tính các giá trtương quan so vi các  
mu chun về đường vin khuôn mt, mt, mũi và ming. Thông qua các giá trtương  
quan này mà hthng squyết định có hay không có tn ti khuôn mt trong nh. Hướng  
tiếp cn này có li thế là rt dcài đặt, nhưng không hiu qukhi tl, tư thế, và hình  
dáng thay đổi.  
1.3.2. Xác định các mu.  
Sakai đã cgng thxác định khuôn mt người chp thng trong nh [20]. Ông  
dùng vài mu con (sub template) vmt, mũi, ming, và đường vin khuôn mt để mô  
hình hóa mt khuôn mt. Mi mu con được định nghĩa trong gii hn ca các đon  
thng. Các đon thng trong nh được trích bng cách xem xét thay đổi ca hsgóc và  
so khp các mu con. Đầu tiên tìm các ng viên thông qua mi tương quan gia các nh  
con và các mu về đường vin. Sau đó, so khp vi các mu con khác. Hay nói mt cách  
khác, giai đon đầu xem như là giai đon sơ chế để tìm ng viên, giai đọan thhai là giai  
đon tinh chế để xác định ng viên có phi là khuôn mt hay không. Ý tưởng này được  
duy trì cho đến các nghiên cu sau này.  
Craw đưa ra mt phương pháp xác định khuôn mt người da vào các mu vhình  
dáng ca các nh được chp thng (dùng vbngoài ca hình dáng khuôn mt). Đầu tiên  
dùng phép lc Sobel (Phép lc Sobel da vào tích vô hướng ca hai vector gradient) để  
tìm các cnh. Các cnh này sẽ được nhóm li theo mt sràng buc. Sau đó, tìm đường  
vin ca đầu, quá trình tương tự được lp đi lp li vi mi tlkhác nhau để xác định  
các đặc trưng khác như: mt, lông mày, và môi. Sau đó Craw mô tmt phương thc xác  
định dùng mt tp có 40 mu để tìm các đặc trưng khuôn mt và điu khin chiến lược  
dò tìm.  
Mt snhà nghiên cu sdng hình chiếu như các mu để xác định khuôn mt  
người. Silhouettes dùng PCA (phân tích thành phn chính – Principal Component  
Analysis - PCA) để có mt tp hình chiếu cơ bn tcác mu khuôn mt, hình chiếu được  
mô tnhư mt mng các bit. Sau đấy dùng đặc trưng hình chiếu kết hp biến đổi Hough  
13  
để xác định khuôn mt người. Phương pháp này định nghĩa mt sgithuyết để mô tcác  
khnăng ca các đặc trưng khuôn mt. Vi mt khuôn mt scó mt tp githuyết, gi  
là lý thuyết DepsterShafer. Dùng mt nhân ttin cy để kim tra stn ti hay không ca  
các đặc trưng ca khuôn mt, và kết hp nhân ttin cy này vi mt độ đo để xem xét có  
hay không có khuôn mt trong nh.  
Sinha dùng mt tp nhcác nh bt biến trong không gian nh để mô tkhông gian  
các mu nh [15, 16]. Tư tưởng chính ca ông da vào sthay đổi mc độ sáng ca các  
vùng khác nhau ca khuôn mt (như hai mt, hai má, và trán), (quan hvmc độ sáng  
ca các vùng còn li thay đổi không đáng k). Sau đấy xác định các cp tsca mc độ  
sáng ca mt svùng (mt vùng ti hơn hay sáng hơn) cho ta mt lượng bt biến khá  
hiu qu. Ông lưu sthay đổi độ sáng ca các vùng trên khuôn mt trong mt tp thích  
hp vi các cp quan hsáng hơn – ti hơn gia các vùng nh. Mt khuôn mt được xác  
định nếu nó tha mãn tt ccác cp sáng hơn – ti hơn. Ý tưởng này xut phát tskhác  
bit ca cường độ gia các vùng kcc btrên nh, sau này nó được mrng trên cơ sở  
biến đổi wavelet để xác định người đi b, xác định xe hơi, xác định khuôn mt. Ý tưởng  
ca Sinha còn được áp dng trong các nghiên cu vthgiác ca robot. Hình 3 cho thy  
mu khuôn mt vi 16 cùng và 23 quan h. Các quan hnày được dùng để phân loi, có  
11 quan hthiết yếu (các mũi tên màu đen) và 12 quan hxác thc (các mũi tên mu  
xám). Mi mũi tên là mt quan h. Mt quan hca hai vùng tha mãn mu khuôn mt  
khi tlgia hai vùng vượt qua mt ngưỡng và mt khuôn mt được xác đinh khi có 23  
quan htha mãn điu kin trên.  
14  
Hình 3: Mt mu khuôn mt  
Mu khuôn mt có kích thước 14 x 16 pixel được  
sdng trong phương pháp định vkhuôn mt ca  
Sinha. Mu gm 16 vùng trên khuôn mt và 23  
quan h( các mũi tên).  
Mt sphương pháp khác như ca Froba và Zink lc cnh ở độ phân gii thp ri  
dùng biến đổi Hough để so khp mu theo hướng cnh để xác định hình dáng khuôn mt  
dng chp hình thng dng xám. Tlchính xác trên 91%. Ngoài ra Shu và Jain còn  
xây dng ngnghĩa khuôn mt. Ngnghĩa xây dng theo hình dáng và vtrí các thành  
phn khuôn mt. Hai ông tbngnghĩa này to mt đồ thquan hệ để ddàng so khp  
khi xác định khuôn mt người …  
1.3.3. Các mu biến dng  
Yuille dùng các mu biến dng để mô hình hóa các đặc trưng ca khuôn mt [3].  
Trong hướng tiếp cn này, các đặc trưng khuôn mt được mô tbng các mu được tham  
shóa và có mt hàm năng lượng (giá tr) được để liên kết các cnh, đỉnh, và thung lũng  
trong nh để tương ng vi các tham strong mu. Mô hình này tt nht khi ti thiu  
hàm năng lượng qua các tham s, Mc dù có kết qutt nhưng phương pháp này có mt  
shn chế đó là các mu biến dng phi được khi to trong phm vi gn vi các đối  
tượng mà nó xác định.  
Rt nhiu hướng tiếp cn da trên dường gp khúc (snake) và các mu để xác định  
khuôn mt. Đầu tiên nh sẽ được làm xon li bi mt lc làm mri dùng phép toán  
15  
morphology để làm ni bt cnh lên. Tiếp theo dùng mt đường gp khúc có n đim nh  
(giá trn nh) để tìm và ước lượng các đọan cong nh. Mi khuôn mt được xp xbng  
mt ellipse và biến đổi Hough, ri tìm mt ellipse ni tri nht. Các ng viên scó bn  
tham smô tnt ellipse (để xác định khuôn mt). Vi mi ng viên, mt phương thc  
tương tnhư phương thc mu biến dng được dùng để xác định các đặc trưng mc chi  
tiết. Nếu tìm thy slượng đáng kcác đặc trưng khuôn mt và tha mãn tlcân đối thì  
xem như đã xác định được mt khuôn mt. Lam và Yan cũng dùng đường gp khúc để  
xác định vtrí đầu vi thut toán greedy để cc tiu hóa hàm năng lượng [11].  
Thay vì dùng đường gp khúc thì Huang và Su [6] dùng lý thuyết dòng chy để xác  
định đường vin khuôn mt da trên đặc tính hình hc. Hai ông dùng lý thuyết tp hp  
đồng mc (Level Set) để loang tcác khi động ban đầu để được các khuôn mt  
người.  
Lanitis mô tmt phương pháp biu din khuôn mt người vi chai thông tin: hình  
dáng và cường độ [12]. Bt đầu bng các tp nh được hun luyn vi các đường vin  
mu như đường bao mt, mũi, cm/má đã được gán nhãn(phân loi). Ông dùng mt  
vector các đim mu để mô thình dáng. Sau đó dùng mt mô hình phân bố đim (Point  
Distribution Model – PDM) để mô tvector hình dáng qua toàn bcác cá th. Dùng cách  
tiếp cn như ca Kirby và Sirovich [14] để mô tcường độ bngoài ca hình dáng đã  
được chun hóa. Để tìm kiếm và ước lượng vtrí khuôn mt cũng như các tham svề  
hình dáng ông sdng mt mô hình PDM có hình dáng như khuôn mt (xác định khuôn  
mt bng mô hình hình dáng tích cc - Active Shape Model - ASM). Các mnh ca  
khuôn mt được làm biến dng vhình dáng trung bình ri trích ly các tham scường  
độ. Sau đấy các tham shình dáng và cường độ được dùng để phân loi và xác định  
khuôn mt.  
1.4. Hướng tiếp cn da trên din mo.  
1.4.1. Tư tưởng ca hướng tiếp cn da trên din mo  
Trái ngược vi hướng tiếp cn da trên so sánh khp mu (các mu đã được các nhà  
nghiên cu định nghĩa trước), các mu trong hướng tiếp cn này được hc tmt tp nh  
mu. Có thnói hướng tiếp cn da trên din mo áp dng các kthut theo hướng xác  
sut thng kê và hc máy để tìm nhng đặc tính liên quan ca khuôn mt và không phi là  
khuôn mt. Các đặc tính đã được hc trong hình thái các mô hình phân bhay các tham  
16  
sca mt hàm snên có thdùng các đặc tính này để xác định khuôn mt người. Đồng  
thi, bài toán gim schiu thường được quan tâm để tăng hiu qutính toán cũng như  
hiu quxác định.  
Trong hướng tiếp cn này, phương pháp xác xut tiếp tc được nhiu nhà nghiên  
cu sdng. Mt bc nh hoc mt vector (đặc trưng cho bc nh) được xem như mt  
biến ngu nhiên. Biến ngu nhiên này sẽ được xác định là có mô tcác đặc tính ca  
khuôn mt hay không thông qua các xác xut có điu kin p(x/face) và p(x/nonface). Có  
thdùng bphân loi Bayesian để phân loi các ng viên là khuôn mt hay không phi  
khuôn mt. Tuy nhiên, vic cài đặt bphân loi Bayesian vi schiu x ln là mt điu  
khá khó khăn, do đó có rt nhiu nghiên cu theo hướng tiếp cn này quan tâm ti vic  
tham shóa hay không tham scác xác xut p(x/face) và p(x/nonface).  
Mt các tiếp cn khác trong hướng tiếp cn da trên din mo là tìm mt hàm bit  
sví dnhư các hàm mô tmt phng hay siêu phng quyết định (các ranh gii) để phân  
bit hai lp khuôn mt và không phi khuôn mt. Thông thường, mt bc nh được chiếu  
vào không gian có schiu ít hơn ri sau đó dùng mt hàm bit s(da trên các độ đo  
khong cách) để phân loi hoc xây dng mt mt quyết định phi tuyến bng mng neural  
đa tng. Ngoài ra có thdùng SVM (Super Vector Machine) và các phương thc kernel  
chiếu các mu vào không gian có schiu cao hơn để dliu bri rc hoàn toàn và từ đó  
có thsdng mt phng phân loi để phân loi các mu là khuôn mt hay không phi là  
khuôn mt[5].  
1.4.2. Mt sphương pháp cthtrong hướng tiếp cn da trên din mo  
Có rt nhiu phương pháp hc máy được sdng trong hướng tiếp cn da trên din  
mo. Trong phn này chnêu ra mt sphương pháp cùng nhng nghiên cu liên quan  
đến phương pháp đấy. Riêng phương pháp adaboost sẽ được trình by trong phn sau ca  
báo cáo.  
a. Adaboost  
Adaboost được đánh giá là phương phát tiếp cn nhanh nht trong các thut toán hc  
máy. Nó thường được kết hp vi các mô hình cascade of classifiers để tăng tc độ phát  
hin khuôn mt trong nh. Tư tưởng ca thut toán adaboost đấy là kết hp các bphân  
loi yếu thành mt bphân loi mnh. Trong quá trình xây dng, bphân loi yếu tiếp  
17  
theo sẽ được xây dng da trên các đánh giá vcác bphân loi yếu trước, cui cùng các  
bphân loi yếu sẽ được kết hp để trthành bphân loi mnh.  
Viola và Jones dùng AdaBoost kết hp cascade để xác định khuôn mt người [17]  
vi các đặc trưng dng Haar-like. Tc độ xlý khá nhanh và tlchính xác hơn 80%.  
Ngoài ra Schneiderman và Kanade dùng wavelet để trích đặc trưng, sau đấy cũng xây  
dng hthng hc vi Adaboost, da trên xác sut để xác định khuôn mt người. Tlệ  
chính xác trên ca phương pháp này lên đến 90%.  
b. Mng Neural  
Vcơ bn mng neural là mt mng các phn t(gi là neuron) kết ni vi nhau  
thông qua các liên kết (các liên kết này được gi là trng sliên kết) để thc hin mt  
công vic cthnào đó. Khnăng xlý ca mng neuron được hình thành thông qua quá  
trình hiu chnh trng sliên kết gia các neuron, nói cách khác là hc ttp hp các  
mu hun luyn.  
Mng neural rt hay được sdng trong các bài toán nhn dng mu, nhn dng mt  
người cũng có thxem là mt bài toán nhn dng vi hai loi mu (mt người hoc không  
phi mt người) và như vy có thsdng mng neural khá hiu qukckhi các mu  
khuôn mt có độ phc tp cao. Tuy nhiên, mt điu trngi đó là các kiến trúc mng đều  
có tính tng quát cao, do đó, khi áp dng ta phi tính toán rõ slượng tng, slượng  
node, tlhc … cho tng trường hp cth.  
c. Support Vector Machine  
Support Vector Machine (SVM) được Vladimir Vapnik đưa ra vào năm 1995 để gii  
quyết vn đề nhn dng mu hai lp sdng nguyên tc cc tiu hóa ri ro cu trúc  
(Structural Risk Minimization). Đây là phương pháp tiếp cn phân loi văn bn rt hiu  
qu. Ưu đim ca SVM là gii thut này được xây dng trên ý tưởng cc tiu ri ro cu  
trúc. Ngun gc ca SVM da trên schc chn vli chính xác, có thphân loi ngu  
nhiên các mu đối tượng được chn mà li được gisao cho nhnht. Vì vy, gii thut  
SVM giúp gim thiu biên trên các li chính xác và làm cho hthng tin cy hơn  
Cho trước mt tp hun luyn, các nh được biu din dưới dng vector. Trong  
không gian vector, mi vertor được biu din bi mt đim. Phương pháp SVM stim  
mt siêu phng quyết định để phân chia không gian vector thành hai lp (khuôn mt và  
18  
không phi khuôn mt). Cht lượng ca siêu phng này phthuc vào khong cách gia  
các vector, tc là phthuc vào các đặc trưng ca nh.  
Support Vector Machine đã được Osuna [5] áp dng đầu tiên (để xác định khuôn  
mt người). SVM được xem như là mt kiu phân loi mi vì trong khi hu hết các  
phương pháp phân loi khác (như Mng Bayes, Nueral, RBF) đều dùng tiêu chí ti thiu  
li hun luyn (ri ro do kinh nghim), trong khi SVM dùng quy np (được gi là ti  
thiu ri ro cu trúc). Phân loi SVM là mt phân loi tuyến tính, do đó nó cũng dùng mt  
siêu phng để tách dliu. Da trên mt skết hp có các trng sca mt tp con nhỏ  
các vector hun luyn, các vector này được gi là support vector. Ước lượng siêu phng  
trong SVM thì tương đương gii mt bài toán tuyến tính bc hai. Osuna [5] đã phát trin  
phương pháp SVM mt cách hiu qucho bài toán xác định khuôn mt người. Ông dùng  
10,000,000 mu có kích thước 19x19 pixel, hthng ca ông có tlli ít hơn và nhanh  
hơn rt nhiu.  
d. Mô hình Markov n  
Mô hình Markov n ( Hidden Markov Model – HMM ) là mt mô hình thng kê  
trong đó hthng được mô hình hóa được cho là mt quá trình Markov vi các tham số  
không biết trước và nhim vlà xác định các tham số ẩn tcác tham squan sát được,  
da trên stha nhn này. Các tham sca mô hình được rút ra sau đó có thsdng để  
thc hin các phân tích kế tiếp, ví dcho các ng dng nhn dng mu.  
Mt githuyết quan trng ca mô hình Markov n là các mu có thể được đặc tính  
hóa như các tiến trình ngu nhiên có tham svà các tham snày được ước lượng chính  
xác, đây là mt trong nhng định nghĩa rõ ràng. Khi phát trin HMM để gii quyết bài  
toán nhn dng mu, phi xác định rõ có bao nhiêu trng thái n đầu tiên cho hình thái mô  
hình. Sau đó, hun luyn HMM hc xác sut chuyn tiếp gia các trng thái tcác mu,  
mà mi mu được mô tnhư mt chui các quan sát. Mc tiêu hun luyn HMM là cc  
đại hóa xác sut ca quan sát tdliu hun luyn bng cách điu chnh các tham số  
trong mô hình HMM thông qua phương pháp phân đon Viterbi chun và các thut toán  
Baum-Welch. Sau khi hun luyn xong, da vào xác sut để xác định mt quan sát thuôc  
lp nào.  
Để hình dung vHMM, ta xét ví dcthsau: GisA có mt người bn B sng ở  
rt xa. Hàng ngày thì B đều gi đin cho A để kvnhng vic mà B đã làm trong ngày.  
19  
B chcó 3 vic mà anh ta thích làm đó là: vic thnht là đi do, thhai là đi chvà thứ  
ba là dn phòng. Và vic anh ta làm vic gì trong ngày phthuc rt ln vào thi tiết ca  
ngày hôm đấy. Như vy, dù không nhn được thông tin cthvthi tiết trong ngày ở  
nơi người B , nhưng người A vn có thda vào vic B làm trong ngày để đoán vthi  
tiết hôm đấy. Như vy nếu coi thi tiết chcó hai trng thái là nng và mưa thì thi tiết là  
mt chui Markov cth, và nó là n đối vi người A. Dliu quan sát được ở đây là  
vic làm trong ngày ca người B. Toàn bhthng này là mt mô hình Mackov n.  
Mt githuyết quan trng ca mô hình Markov n là các mu có thể được xem như  
các tiến trình ngu nhiên có tham svà các tham snày được ước lượng chính xác. Khi  
phát trin HMM để gii quyết bài toán nhn dng mu, phi xác định rõ có bao nhiêu  
trng thái n đầu tiên cho hình thái mô hình. Sau đó, hun luyn HMM hc xác sut  
chuyn tiếp gia các trng thái tcác mu, mà mi mu được mô tnhư mt chui các  
quan sát. Mc tiêu hun luyn HMM là cc đại hóa xác sut ca quan sát tdliu hun  
luyn bng cách điu chnh các tham strong mô hình HMM thông qua phương pháp  
phân đon Viterbi chun và các thut toán Baum-Welch. Sau khi hun luyn xong, da  
vào xác sut để xác định mt quan sát thuôc lp nào.  
Hình 4: các vector quan sát để hun luyn cho HMM  
20  
Hình 5: Các trng thái n  
Đối vi bài toán phát hin và nhn dng mt người, ta chia khuôn mt thành các  
vùng khác nhau như đầu, mt, mũi, ming, và cm. Có thnhn dng mt mu khuôn mt  
người bng cách thc hin tiến trình xem xét các vùng quan sát theo mt thtthích hp  
(ttrên xung dưới, ttrái qua phi). Mc tiêu ca hướng tiếp cn này là kết hp các  
vùng đặc trưng khuôn mt vi các trng thái ca mô hình.  
Hình 6: Xác định khuôn mt bng HMM  
Mi trng thái li có nhng trng thái nhbên trong: trng thái trán  
có ba trng thái nhbên trong; trng thái mt có năm trng thái nhỏ  
bên trong.  
Thường các phương pháp da vào HMM sxem xét mt mu khuôn mt như mt  
chui các vector quan sát, vi mi vector là mt dãy các đim nh (hình 4 và hình 6).  
Trong quá trình hun luyn và kim tra, mt nh được quét theo mt thtvà mt quan  
sát được xem như mt khi các đim nh (hình 4 và hình 6). Sau đấy, áp dng mt định  
hướng theo xác sut để chuyn ttrng thái này sang trng thái khác ( hình 5 ), dliu  
nh được mô hình hóa bng phân bGauss đa biến. Mt chui quan sát bao gm tt cả  
giá trcường độ tmi khi. Kết quxut ra cho biết quan sát thuc lp nào.  
21  

Tải về để xem bản đầy đủ

pdf 53 trang yennguyen 24/04/2025 30
Bạn đang xem 30 trang mẫu của tài liệu "Khóa luận Phát hiện mặt người trong ảnh và ứng dụng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfkhoa_luan_phat_hien_mat_nguoi_trong_anh_va_ung_dung.pdf