Khóa luận Trích chọn đặc trưng trên khuôn mặt người

ĐẠI HỌC CÔNG NGHỆ  
ĐẠI HỌC QUỐC GIA HÀ NỘI  
--------  
Nguyễn Thành Trung  
TRÍCH CHỌN ĐẶC TRƯNG TRÊN KHUÔN MẶT  
NGƯỜI  
KHÓA LUẬN TỐT NGHIỆP HỆ CHÍNH QUY  
Ngành: Công Nghệ Thông Tin  
Hà Nội – 2010  
ĐẠI HỌC CÔNG NGHỆ  
ĐẠI HỌC QUỐC GIA HÀ NỘI  
--------  
Nguyễn Thành Trung  
TRÍCH CHỌN ĐẶC TRƯNG TRÊN KHUÔN MẶT  
NGƯỜI  
KHÓA LUẬN TỐT NGHIỆP HỆ CHÍNH QUY  
Ngành:  
Công Nghệ Thông Tin  
GV hướng dẫn: PGS.TS. Bùi Thế Duy  
Hà Nội – 2010  
Nhận dạng các điểm đặc trưng trên khuôn mặt người  
Nguyễn Thành Trung  
Lời cảm ơn  
Trước tiên, em xin gửi lời cảm ơn sâu sắc nhất đến thầy Bùi Thế Duy, người đã  
không quản vất vả hướng dẫn em trong suốt thời gian làm khóa luận tốt nghiệp vừa  
qua. Em cũng xin chân thành cảm ơn các anh chị, thầy cô trong phòng tương tác người  
- máy đã luôn chỉ bảo mỗi khi em có những vấn đề vướng mắc.  
Em xin bày tỏ lời cảm ơn sâu sắc đến các thầy cô giáo trong Trường Đại Học Công  
Nghệ đã tận tình dạy dỗ em suốt bốn năm học qua.  
Con xin cảm ơn bố, mẹ và gia đình đã luôn bên con, cho con động lực để làm việc  
tốt hơn. Cảm ơn tất cả bạn bè đã luôn sát cánh cùng tôi.  
Hà Nội, ngày 20 tháng 5 năm 2010  
Nguyễn Thành Trung  
i
 
Nhận dạng các điểm đặc trưng trên khuôn mặt người  
Nguyễn Thành Trung  
Tóm tắt  
Bài toán trích chọn đặc trưng trên ảnh mặt người là bài toán cơ bản và quan trọng  
trong nhóm các bài toán về xử lý ảnh mà đầu vào là ảnh 2D. Đầu ra của nó được sử  
dụng làm đầu vào cho bài toán nhận dạng mặt, nhận dạng cảm xúc,... Trong khóa luận  
này chúng tôi đưa ra một phương pháp lai và xây dựng hệ thống áp dụng phương pháp  
lai này nhằm mục đích nhận dạng các điểm đặc trưng trong các bức ảnh mặt người  
thông qua hướng tiếp cận trích chọn đặc trưng hình học. Hệ thống của chúng tôi đã  
được xây dựng hoàn chỉnh và các kết quả chạy thử nghiệm trên bộ dữ liệu Cohn –  
Kanade thu được là khả quan.  
ii  
 
Nhận dạng các điểm đặc trưng trên khuôn mặt người  
Nguyễn Thành Trung  
Mục lục  
iii  
 
Nhận dạng các điểm đặc trưng trên khuôn mặt người  
Nguyễn Thành Trung  
Chương 4 Xây dựng hệ thống nhận dạng các điểm đặc trưng............................................................................25  
iv  
Nhận dạng các điểm đặc trưng trên khuôn mặt người  
Nguyễn Thành Trung  
Danh sách hình vẽ  
Hình 13 - Tập hợp các điểm xung quanh Ptt......................................................................................................20  
v
 
Nhận dạng các điểm đặc trưng trên khuôn mặt người  
Nguyễn Thành Trung  
vi  
Nhận dạng các điểm đặc trưng trên khuôn mặt người  
Nguyễn Thành Trung  
Danh sách bảng  
vii  
 
Chương 1. Giới thiệu  
Nguyễn Thành Trung  
Chương 1  
Giới thiệu  
Trong tất cả các nền văn minh từ trước đến nay, giao tiếp là một hoạt động không  
thể thiếu, nó xuất hiện mọi nơi mọi lúc, trong mọi lĩnh vực và ảnh hưởng trực tiếp tới  
cuộc sống của từng cá thể. Giao tiếp là một nhu cầu xã hội cơ bản, xuất hiện sớm  
nhất trong đời sống của mỗi người và là yếu tố ảnh hưởng trực tiếp tới quá trình hình  
thành lên tâm sinh lý của con người. Hơn thế nữa, giao tiếp giúp con người có thể  
truyền tải thông tin, học hỏi tri thức và thể hiện cảm xúc. Nhờ có giao tiếp làm cho con  
người văn hóa, xã hội văn minh và đất nước phát triển. Nhận thấy tầm quan trọng của  
hoạt động giao tiếp nên con người đã bỏ rất nhiều thời gian và công sức vào nghiên  
cứu yếu tố quyết định thành công của việc giao tiếp, không chỉ trong lĩnh vực giao tiếp  
giữa con người với con người, mà ngày nay con người đã bắt đầu nghiên cứu về các hệ  
thống tương tác người – máy. Mặt khác, trong giao tiếp thì khuôn mặt là nơi con người  
thể hiện suy nghĩ, tình cảm, thái độ nên để con người và máy tính có thể tương tác với  
nhau tự nhiên hơn thì các hệ thống được xây dựng dựa trên nền tảng là những thay đổi  
của khuôn mặt. Muốn xác định được các thay đổi đó cần trích chọn được ra các yếu tố  
riêng biệt của từng khuôn mặt, trên khía cạnh đó bài toán Trích chọn đặc trưng trên  
khuôn mặt ra đời là động lực to lớn thúc đẩy sự phát triển của các hệ thống tương tác  
người – máy tự động. Là một bài toán cơ bản và đã có rất nhiều các giải pháp trích  
chọn đặc trưng khác nhau được đưa ra nhưng hầu hết các giải pháp trước đó đều gặp  
khó khăn trong việc xử lý các bức ảnh khuôn mặt với độ phân giải khác nhau hay với  
những điều kiện ánh sáng không thuận lợi. Trong khóa luận này, chúng tôi sẽ trình bày  
về phương pháp lai để xác định các điểm đặc trưng trên khuôn mặt. Phương pháp lai  
này sẽ khắc phục được những khó khăn mà các phương pháp trước đó gặp phải như  
ảnh hưởng của điều kiện ánh sáng hay một số nhiễu trong ảnh. Dựa vào phương pháp  
lai này chúng tôi xây dựng lên một hệ thống để xác định 20 điểm đặc trưng, hệ thống  
đã được chạy thử nghiệm trên bộ dữ liệu Cohn – Kanade và cho kết quả khả quan.  
Phần còn lại của khóa luận được trình bày như sau: tại Chương 2 chúng tôi giới thiệu  
tổng quan về bài toán phát hiện khuôn mặt người trong ảnh 2D. Tiếp theo, chúng tôi  
1
 
Chương 1. Giới thiệu  
Nguyễn Thành Trung  
trình bày tổng quan về các phương pháp trích chọn đặc trưng trên khuôn mặt người  
trong Chương 3. Sau đó, tại Chương 4 chúng tôi trình bày về hệ thống nhận dạng các  
đặc trưng trên khuôn mặt của mình. Cuối cùng là phần tổng kết, đánh giá và hướng  
phát triển chúng tôi trình bày trong Chương 5.  
2
Chương 2. Phát hiện khuôn mặt người trong ảnh  
Nguyễn Thành Trung  
Chương 2  
Phát hiện khuôn mặt người trong ảnh 2D  
2.1 Giới thiệu  
Bài toán trích trọn đặc trưng trên ảnh khuôn mặt người đã được quan tâm từ khá lâu do  
có rất nhiều ứng dụng như: Sử dụng trong hệ thống nhận dạng cảm xúc, hệ thống  
tương tác giữa người và máy (điều khiển máy tính qua các cử động của khuôn mặt), hệ  
thống nhận dạng người (giúp cho các cơ quan an ninh quản lý con người), hệ thống  
quan sát theo dõi như hệ thống quản lý việc ra vào cho các cơ quan và công ty, hệ  
thống kiểm tra người lái xe có ngủ gật hay không, hệ thống phân tích cảm xúc trên  
khuôn mặt, hệ thống nhận dạng khuôn mặt cho các máy ảnh kỹ thuật số,...  
Ngày nay, đã có rất nhiều các phương pháp trích chọn đặc trưng với những cách thức  
rất khác nhau nhưng tất cả các phương pháp đó đều bao gồm hai công đoạn chính là:  
Phát hiện khuôn mặt người trong ảnh,  
Trích chọn đặc trưng.  
Để hiểu rõ hơn về bài toán trích chọn đặc trưng và các công đoạn trong bài toán trích  
chọn đặc trưng, đầu tiên chúng tôi sẽ trình bày tổng quan về công nghệ phát hiện  
khuôn mặt trong ảnh 2D.  
2.2 Tổng quan về công nghệ phát hiện khuôn mặt  
2.2.1 Chiến lược phát hiện khuôn mặt  
Hiện nay có rất nhiều phương pháp nhận dạng khuôn mặt người, dựa vào các tính chất  
của các phương pháp, ta có thể chia ra làm hai hướng tiếp cận chính như sau:  
Hướng tiếp cận dựa trên đặc trưng cơ bản  
Đây là phương pháp dựa chủ yếu trên những hiểu biết của con người về khuôn mặt. Ví  
dụ như những bộ phận trên khuôn mặt mắt, mũi, miệng, ngoài ra còn có thể về hình  
3
       
Chương 2. Phát hiện khuôn mặt người trong ảnh  
Nguyễn Thành Trung  
dạng, đường nét hay cấu tạo của khuôn mặt. Trong phướng pháp này có 2 chiến lược  
tiếp cận khác nhau là:  
Từ dưới lên (Bottum-up): Cố gắng xác định từng đặc trưng riêng biệt sau đó nhóm  
chúng lại với nhau và kiểm tra lại. Phương pháp này có ưu điểm là không bị ảnh  
hưởng của hướng xoay hay di chuyển của khuôn mặt nhưng có một số giới hạn  
sau:  
Thứ nhất, các đặc trưng dễ bị ảnh hưởng bởi các yếu tố như độ sáng tối, hay  
nhiễu trong ảnh.  
Thứ hai, các bước thực hiện trong cách tiếp cận này đòi hỏi chi phí quá đắt  
về thời gian nên không đáp ứng được yêu cầu thời gian thực.  
Từ trên xuống (Top-down): Tạo ra một mẫu hay model về khuôn mặt chuẩn có thể  
là 2 chiều hoặc 3 chiều, sau đó cố gắng ghép mẫu đó vào bức ảnh. Phương pháp  
này có những nét chính sau:  
Xây dựng mẫu,  
Tìm kiếm trên toàn bộ ảnh đề ghép mẫu với những thực thể trên ảnh đề tìm  
ra.  
Một phương pháp tiếp cận theo hướng từ trên xuống là Active Shape Model  
được đưa ra bởi Cootes tại [24].  
Hướng tiếp cận dựa trên diện mạo  
Phương pháp này nhận dạng khuôn mặt tập trung vào vấn đề phân lớp chính là phân  
lớp một bức ảnh (có kích thước cố định) vào 2 lớp là mặt hoặc không. Phương pháp  
học từ một tập ảnh huấn luyện mẫu để xác định khuôn mặt người. Phương pháp này  
gồm một số bước chính sau:  
Tạo ra bộ phân lớp mặt – không phải mặt bằng cách dùng một số phương  
pháp biểu diễn khuôn mặt như LBP, Gabor.  
Sử dụng một cửa sổ có kích thước cố định quét trên toàn bộ bức ảnh đầu vào  
ở vị trí và tỷ lệ khác nhau hoặc dùng trên toàn bộ bức ảnh.  
Bước cuối cùng là xử lý các trường hợp phát hiện trùng lặp.  
Trong hai hướng tiếp cận trên, hướng tiếp cận dựa trên đặc trưng diện mạo có ưu điểm  
vượt trội hơn so hướng tiếp cận cơ bản là không phụ thuộc vào hướng quay của đầu  
4
Chương 2. Phát hiện khuôn mặt người trong ảnh  
Nguyễn Thành Trung  
trong bức ảnh. Để trích chọn đặc trưng cơ bản được chính xác, chúng ta cần có thêm  
một bước tiền xử lý là xác định hướng quay của đầu trong ảnh, cụ thể về các phương  
pháp xác định hướng quay sẽ được trình bày trong phn 2.2.2.  
2.2.2 Xác định hướng quay của đầu  
Xác định hướng nhìn là một vấn đề nảy sinh cần giải quyết trong nhận dạng khuôn  
mặt. Một số phương pháp nhận dạng khuôn mặt trình bày ở trên có thế không bị ảnh  
hưởng của hướng nhìn thông thường là những phương pháp tiếp cận theo hướng diện  
mạo nhưng xác định hướng nhìn cần được xem xét như một phần riêng biệt trong nhận  
dạng khuôn mặt. Hiện nay có rất nhiều phương pháp xác định hướng nhìn được đưa ra,  
tổng quan về các phương pháp được trình bày bởi Murphy Chutorian và Trivedi [16]  
Tian [15] đã đưa ra một phương pháp xác định hướng nhìn. Phương pháp trình bày xác  
định hướng của khuôn mặt đầu tiên thay vì xác định khuôn mặt như các phương pháp  
thông thường. Những bước sử dụng để xác định được đường cắt của phần đầu trong  
bức ảnh:  
Xác định đường viền bao xung quanh trọng tâm C và trục tọa độ theo chiều dọc  
(trục y) của bóng.  
Xác định những phần cho đường cong lõm (có đạo hàm âm) nhỏ nhất trên  
đường viền của bóng.  
Tính độ thừa của những phần nhô ra đề xác định tỷ lệ chu vi (trừ những phần  
cắt) mục đích là đo độ dài của đường cắt.  
Kiểm tra những phần nhô ra vượt quá ngưỡng thấp.  
Kiểm tra những đường cắt giao với trục y của bóng.  
Chọn đường cắt đầu tiên nếu có nhiều đường cắt thỏa mãn.  
5
 
Chương 2. Phát hiện khuôn mặt người trong ảnh  
Nguyễn Thành Trung  
Hình 1 Xác định đường cắt của đầu.  
Sau khi đường cắt L của đầu được xác định vùng đầu được xác định dễ dàng – là phần  
trên tính từ đường cắt. Để xác định được vùng đầu chính xác đưa ra một trọng số của  
đầu là H = α * W với W là độ rộng của đầu và α = 1.4. Sau khi xác định được vị trí của  
phần đầu thì bức ảnh được chuyển sang định dạng gray-scale (đen - trắng) sau đó cân  
bằng histogram và điều chỉnh kích thước về độ phân giải đánh giá. Sau đó sử dụng  
mạng nơron 3 tầng đề xác định hướng của đầu. Đầu vào là bức ảnh (sau khi đã nhân  
xoắn với ma trận mặt nạ Gauss và 3 mẫu quay – bất biến Gabor). Đầu ra của mạng là 3  
hướng quay của đầu : 1) trực diện hoặc gần trực diện 2) Nhìn sang hoặc nhìn nghiêng  
3) Trường hợp nhìn ra sau hoặc không xác định được.  
6
 
Chương 2. Phát hiện khuôn mặt người trong ảnh  
Nguyễn Thành Trung  
Hình 2  Ví dụ về 3 hướng quay của đầu.  
2.2.3 Một số phương pháp dùng phát hiện khuôn mặt  
Ngày nay có rất nhiều các phương pháp nhận dạng khuôn mặt như: Eigenface [25],  
FA (factor Analsys) [26], FLD (Fisher‟s Linear Discriminant) [27], Active Apperance  
Model [24],...  
Các phương pháp trên có một số nhược điểm như:  
Tốc độ chậm, không đáp ứng được yêu cầu thời gian thực,  
Xây dựng hệ thống quá phức tạp.  
Vượt lên trên các phương pháp khác với tốc độ thực hiện nhanh và độ chính xác chấp  
nhận được. Viola và Jones [30] đưa ra phương pháp nhận dạng khuôn mặt dùng đặc  
trưng giống Haar kết hợp với phương pháp học máy Adaboost. Phương pháp gồm 2  
bước cơ bản: Đầu tiên là trích chọn đặc trưng giống Haar của ảnh khuôn mặt người và  
không phải mặt người trong cơ sở dữ liệu. Sau đó dùng bộ học máy mạnh là Adaboost  
để xây dựng mô hình phân loại. Cụ thể phương pháp được trình bày trong phần 2.3.  
7
   
Chương 2. Phát hiện khuôn mặt người trong ảnh  
Nguyễn Thành Trung  
2.3 Nhận dạng khuôn mặt dùng đặc trưng giống Haar và  
Adaboost  
2.3.1 Cơ sở lý thuyết đặc trưng giống Haar  
Một số đặc trưng giống Haar thường dùng như:  
+ Đặc trưng cạnh (Edge Features):  
+ Đặc trưng đường thẳng (Line Features):  
+ Đặc trưng tâm xung quanh (Center surround Features):  
Dùng các đặc trưng trên ta có thế tính được các giá trị của đặc trưng giống Haar bằng  
cách lấy hiệu tổng giá trị điểm ảnh trong vùng màu đen và tổng giá trị điểm ảnh trong  
vùng màu trắng theo công thức sau:  
 
 
fgiống Haar  
=
푝푖푥푒 ù푛푔 đ푒푛 푝푖푥푙 ù푛푔 푡푟푛푔  
Như vậy, để tính giá trị của đặc trưng giống Haar thì phải tính tổng giá trị từng pixel  
để tính giá trị của đặc trưng giống Haar cho tất cả vị trí trên ảnh cần chi phí tính toán  
quá lớn, không đáp ứng được yêu cầu thời gian thực. Do đó Viola [25] đưa ra một  
cách thức tính mới như sau:  
+ Tính từ một bức ảnh bình thường thông qua một số các toán tử trên pixel ta thu đuợc  
một bức ảnh mới gọi là ảnh tích hợp:  
ii(x,y) = ∑(x‟,y‟) (x‟ < x,y „ <y)  
8
   
Chương 2. Phát hiện khuôn mặt người trong ảnh  
Nguyễn Thành Trung  
s(x,y) = s(x,y-1) + i(x,y)  
ii(x,y) = ii(x-1,y)+s(x,y)  
s(x,-1) = 0  
ii(-1,y) = 0  
s(x,y) là tổng các pixel theo hàng.  
+ Sau khi tính được ảnh tích hợp thì việc tính toán giá trị mức xám là rất đơn giản.  
Ví dụ:  
Hình 3 – Ảnh tích hợp  
Ta mun tính tng giá các pixel trong min D:  
D = A + B + C + D ( A + B) ( A + C ) + A  
Hay  
 
 
 
 
 
 
 
 푝푖푥푒 =  푝푖푥푒 +  푝푖푥푒 +  푝푖푥푒 +  푝푖푥푒 - {  푝푖푥푒 +  푝푖푥푒 } - {  
 
 
 
 푝푖푥푒 +  푝푖푥푒 } +  푝푖푥푒  
Nhưng trong ảnh tích hp chúng ta chphi thc hiện phép tính đơn giản:  
 
 푝푖푥푒 = P4 (P1 + P2) + P3  
Tiếp theo để la chọn đặc trưng ging Haar dùng cho thiết lập ngưỡng Viola và Jones  
[25] dùng phương pháp học máy AdaBoost.  
2.3.2 Phương pháp học máy Adaboost  
Tng quan  
Adaboost là phương pháp học máy được xây dng bi Yoav Freund và Robert  
Schapire [31] vào năm 1995. Là mt ci tiến ca hướng tiếp cn kết hp các bphân  
lớp đơn giản để to thành mt bphân lp chung mà khả năng phân lớp ca bchung  
tăng lên đáng k.  
Trong phương pháp Adaboost Yoav và Robrert [31] đưa thêm khái niệm trng số  
để đánh dấu các mu khó nhn dng. Trong quá trình hun luyn, Adaboost gi các bộ  
phân lp yếu lp li trong t lần t = 1,2, … T. Trong mỗi ln gọi đó, các trọng sDt  
9
   
Chương 2. Phát hiện khuôn mặt người trong ảnh  
Nguyễn Thành Trung  
được cp nht li theo nguyên tc: tăng trọng sca các mu nhn dng sai và gim  
trng sca các mu nhn dạng đúng. Mc tiêu là sau mi ln lp thì bphân lp yếu  
sau stp trung trên các mu nhn dạng sai để tăng độ chính xác.  
Thut toán  
Viola và Jones [30] dùng Adaboost kết hp các bphân loi yếu và đặc trưng  
giống Haar như sau:  
Hình 4  Sơ đồ hệ thống nhận dạng khuôn mặt.  
Mi một đặc trưng fj bphân lp yếu xây dng mt hàm phân lp tối ưu ngưỡng hj(x)  
(ví dụ điều kin tối ưu có thế là smu sai là ít nht)  
hj(x) = {10 ếư<   
Trong đó :  
10  
 
Chương 2. Phát hiện khuôn mặt người trong ảnh  
Nguyễn Thành Trung  
+ x : ca scon (thường dùng là 24x24 pixel),  
+  : ngưỡng,  
+ fj: giá trị đặc trưng ging Haar,  
+ pj : hsquyết định chiu của phương trình.  
Mô tthut toán :  
Có mt tp các bc nh (x1, y1) , … , (xn,yn) vi yi = 0,1 ng vi các mu không  
là khuôn mt hoc là khuôn mt.  
Khi to các trng sw1,I = 1/2m, 1/2l vi yi tương ứng là 0 hoc 1 vi m, l là  
tng các mu là khuôn mt hoc không là khuôn mt ( m + l = n).  
For t = 1,…, T  
1. Chun hóa trng số  
 
Wt,I = Wt,I /  =1 푊푡,  
2. Vi mỗi đặc trưng j, huấn luyn bphân lp hj ng với đặc trưng j. Lỗi  
    
푤푖  |푕푗 푥푖  푦푖|  
 
được đánh giá như sau : wt, ej =  
3. Chn bphân lp ht vi li et là nhnht  
4. Cp nht li trng số  
Wt+1,I = Wt,I 1−푒푖 vi ei = 0 nếu mẫu xi được phân lớp đúng và ei=1  
trường hợp ngược li.  
푒푡  
 =  
1  푒푡  
5. Bphn lp cui cùng là bphân lp mạnh được xác định như sau  
1
    
=1 훼푡  푕푡  >  
 
 
=1 훼푡  
1
2
H(x) =   
0 푛푔ượ 푙ạ푖  
11  
Chương 2. Phát hiện khuôn mặt người trong ảnh  
Nguyễn Thành Trung  
Xây dng hthng  
Hình 5  Hthng nhn dng khuôn mt.  
Trong sơ đồ trên, từ ảnh gốc chúng ta tính được nh tích hp, mục đích để tính  
nhanh các chênh lệch độ xám ca các hình chnht trong nh gc. Ước lượng các đặc  
trưng ging Haar. Kết quả ước lượng sẽ được đưa qua bộ điều chnh Adaboost để loi  
bbớt các đặc trưng không cần thiết để gim số lượng các đặc trưng. Các đặc trưng  
còn li sẽ được đưa qua bộ phân lớp đề có quyết định xem có là mt hay không. Mi  
bphân loi yếu squyết định kết qucho một đặc trưng ging Haar, được xác định  
ngưỡng đủ nhsao cho có thể vượt qua tt ccác bdliu trong tp mu hun luyn.  
Trong quá trình xác định khuôn mặt người, mi vùng nh con sẽ được kim tra vi các  
đặc trưng trong chuỗi đặc trưng ging Haar, nếu có một đặc trưng ging Haar nào đó  
không cho ra kết qulà khuôn mặt người thì các đặc trưng khác không cần xét na.  
Thtự xét các đặc trưng ging Haar trong chui sẽ được xác định da vào trng số  
của đặc trưng đó, do Adaboost quyết định da vào sln và thtxut hin ca các  
đặc trưng giống Haar.  
12  
 
Chương 3 : Trích chọn đặc trưng trên khuôn mặt  
Nguyễn Thành Trung  
Chương 3  
Tổng quan về các phương pháp trích chọn đặc  
trưng  
Trong chương này phần đầu chúng tôi sẽ trình bày tổng quan về các hướng tiếp cận  
để trích chọn đặc trưng. Tiếp đó chúng tôi sẽ trình bày về hai hướng tiếp cận chính là  
trích chọn đặc trưng là trích chọn đặc trưng hình học và đặc trưng diện mạo.  
3.1 Các hướng tiếp cận  
Hiện nay có rất nhiều các phương pháp trích dẫn dữ liệu từ khuôn mặt, mỗi phương  
pháp có những ưu nhược điểm và đặc điểm riêng nhưng theo cách thức mà những  
phương pháp và hình thức của dữ liệu được trích dẫn thì chia ra làm 2 hướng tiếp cận  
chính:  
Thứ nhất, hướng tiếp cận dựa trên đặc trưng hình học là hướng tiếp cận dựa vào  
các bức ảnh trực diện khuôn mặt lấy từ khâu phát hiện khuôn mặt, trích chọn đặc trưng  
vhình hc biu din hình dáng, vtrí các phn ca khuôn mặt như mắt, mũi, ming,  
lông mày. Cthể xác định một số các điểm đặc trưng trên khuôn mặt: 2 mống mắt,  
điểm chính giữa miệng, khóe miệng, một số các điểm khác ở vùng trán, mắt,…  
Thứ hai, hướng tiếp cận dựa trên đặc trưng diện mạo hướng tiếp cận dựa vào cấu  
trúc phân bổ của cường độ sáng của điểm ảnh trên bề mặt của bức ảnh để trích chọn  
các đặc trưng.  
Trong đó trích chọn đặc trưng diện mạo có ưu điểm là ít phức tạp hơn phương pháp  
trích chọn đặc trưng hình học, các khâu ít hơn nhưng độ chính xác thường thấp hơn.  
Tùy thuộc vào yêu cầu hệ thống chúng ta có thể áp dụng các phương pháp khác nhau,  
Tuy nhiên kết quả tối ưu nếu chúng ta áp dụng cả hai phương pháp trên xuất hiện  
phương pháp thứ ba là phương pháp lai (hybrid) giữa hai phương pháp sử dụng đặc  
trưng hình học và đặc trưng diện mạo.  
13  
   
Chương 3 : Trích chọn đặc trưng trên khuôn mặt  
Nguyễn Thành Trung  
3.2 Phương pháp trích chọn đặc trưng hình học  
3.2.1 Tổng quan  
Những đặc trưng hình học thường là nhng vị trí đặc bit trên khuôn mặt như góc của  
mt, miệng,… hoặc là hình dáng ca các bphn trên khuôn mặt như mắt, ming, lông  
mày,…  
3.2.1 Xác định các điểm đặc trưng trên khuôn mặt  
Yang [3] đã phát triển mt hthng thi gian thực để xác định và theo vết các điểm  
đặc trưng như mống mt, khóe ming hay lỗ mũi. Phương pháp tìm kiếm 2 vùng mt  
là 2 vùng ti nht và sdụng các điều kin vhình học như vị trí bên trong mt, kích  
thước và hình dáng để xác định. Phương pháp dùng phép lặp lấy ngưỡng để phát hin  
ra vùng ti nht với điều kiện ánh sáng thay đổi. Xác định lỗ mũi cũng tương tự như  
xác định 2 mng mt.  
Hình 6  Lặp để xác định ngưỡng trên cửa sổ tìm kiếm  
Để xác định khóe môi, xác định vtrí theo chiu dc sdng phép chiếu toàn btheo  
trc x. Vtrí theo trục x được xác định bng phép chiếu toàn btrên nh ca cnh  
ming.  
14  
       
Chương 3 : Trích chọn đặc trưng trên khuôn mặt  
Nguyễn Thành Trung  
Hình 7  Phép chiếu toàn b.  
Để dò tìm khóe miệng sử dụng hai phương pháp:  
+ Tìm điểm ảnh có độ xám lớn nhất trong các vùng dự kiến sau đó tìm xác định điểm  
khóe miệng sẽ nằm trên đường giữa 2 môi.  
+ Tìm phần có giá trị điểm ảnh tối nhất trên đường giữa hai môi, chắc chắn khoảng  
cách giữa 2 vùng đảm bảo điều kiện thỏa mãn về khoảng cách giữa 2 khóe miệng trên  
thực tế và chọn vị trí có độ tương phản là cao nhất.  
Hình 8  Xác định 2 đường biên ngang của môi.  
Phương pháp trên có một số những ưu điểm như thỏa mãn điều kiện thực thi với thời  
gian thực. Một số phương pháp có thể áp dụng với những độ phân giải khác nhau (với  
cả độ phân giải thấp), tuy nhiên vẫn có trường hợp phát hiện ra lông mày thay vì mắt.  
Tian [4] đã giải quyết vấn đề bằng cách phát hiện cả vùng mắt và lông mày. Bằng cách  
đó, không chỉ trích chọn được thêm đặc trưng mà tỷ lệ chính xác còn được tăng lên.  
Đối với xác định khóe miệng, trường hợp sai là khi miệng không ở trạng thái bình  
thường và phương pháp áp dụng đối với mặt trực diện hoặc gần trực diện.  
Vukadinovic & Pantic [5] sdng Gabor wavalets và Gentle – Boost để xây dng hệ  
thng nhn dng tự động 20 điểm đặc trưng. Trong phương pháp, họ chia khuôn mt  
thành 20 vùng nh(ROIs) và mi vùng ng vi mt điểm đặc trưng. Mi mt vector  
15  
 
Chương 3 : Trích chọn đặc trưng trên khuôn mặt  
Nguyễn Thành Trung  
đặc trưng ứng vi vùng ảnh kích thước 13x13 pixel, có độ ln là 13x13x(18+1) =  
8281. Những vector đặc trưng được sdụng để xây dng mt mô hình và dự đoán một  
điểm có là điểm đặc trưng hay không. Trong khi huấn luyện, mô hình đặc trưng Gentle  
boost sdụng các vector đặc trưng trích chọn tcác ví dhun luyn. Trong khi  
kim tra, mt ca sổ kích thước 13x13 pixel được quét trên toàn bvùng quan tâm.  
Vi mi mt vtrí ca ca sổ trượt, so sánh sging nhau gia giá trca ca sổ trượt  
và mô hình mu. Sau khi quét hết vùng quan tâm thì điểm có độ lch vi mu là nhỏ  
nht sẽ được chn.  
Hình 9  Sơ đồ hệ thống tự động xác định điểm đặc trưng.  
3.2.2 Phát hiện hình dáng các bộ phận trên khuôn mặt  
Tian [17] phát triển phương pháp nhiều trạng thái để trích chọn đặc trưng hình học  
trong hình Hình 10. Một mô hình môi 3 trạng thái miêu tả trạng thái của môi: mở,  
đóng, ngậm chặt. Mô hình 2 trạng thái được dùng cho mỗi mắt, mô hình một trạng thái  
cho má và lông mày. Một số đặc trưng diện mạo sử dụng mô hình 2 trạng thái: có thể  
hiện và vắng mặt. Đường viền của các đặc trưng và thành phần được điều chỉnh bằng  
tay trong bước khởi tạo. Sau khi khởi tạo, tất cả các thay đổi của đặc trưng sẽ được dò  
tìm và phát hiện trong chuỗi ảnh. Thuật toán sử dụng các trạng thái dò tìm khác nhau  
là cải tiển của thuật toán Lucas-Kanade [11]. Tuy nhiên có giới hạn là chuyển động  
của đầu.  
16  
   
Chương 3 : Trích chọn đặc trưng trên khuôn mặt  
Nguyễn Thành Trung  
Phương pháp có thể phát hiện 16 Aus với độ chính xác là 95.5% trên bộ cơ sở dữ  
liệu Cohn – Kanade.  
Hình 10 – Mô hình nhiều trạng thái với mặt trực diện.  
3.2.3 Nhân trắc học và áp dụng với phương pháp trích chọn đặc trưng  
hình học  
Nhân trắc học là một ngành khoa học nghiên cứu về đo lường các thành phần khác  
nhau trên cơ thể con người. Những thông tin về kích thước, vị trí của các thành phần  
trên cơ thể phụ thuộc vào tri thức về chủng tộc, nhóm người. Sau khi đo đạc chính xác  
17  
   
Chương 3 : Trích chọn đặc trưng trên khuôn mặt  
Nguyễn Thành Trung  
các chỉ số từ 300 bức ảnh của 150 người ở các vùng địa lý khác nhau có thể xây dựng  
một mô hình cho khuôn mặt dùng để định vị các vùng đặc trưng từ bức ảnh khuôn mặt  
Tốt hơn là sử dụng toàn bộ mốc như Farkas [28] đã dùng, trong mô hình chỉ sử dụng  
một lượng nhỏ các điểm làm mốc.  
Hình 11 – Mô hình nhân trắc học của mặt (a) Các điểm mốc, (b) Khoảng cách.  
Bảng 1 – Tỷ lệ khoảng cách giữa các mốc.  
Tỷ lệ  
Miêu tả  
Hằng số  
Tỷ lệ khoảng cách giữa tâm mắt phải và tâm lông  
mày phải với khoảng cách giữa 2 tâm mắt  
~ 0.33  
D2/D1  
Tỷ lệ khoảng cách giữa tâm mắt trái và tâm lông  
mày trái với khoảng cách giữa 2 tâm mắt  
~0.33  
~ 0.6  
~1.1  
D3/D1  
D4/D1  
D5/D1  
Tỷ lệ khoảng cách giữa tâm 2 mắt và đỉnh mũi với  
khoảng cách giữa 2 tâm mắt.  
Tỷ lệ khoảng cách giữa tâm 2 mắt và điểm giữa  
miệng với khoảng cách giữa 2 tâm mắt.  
18  
   
Chương 3 : Trích chọn đặc trưng trên khuôn mặt  
3.3 Trích chọn đặc trưng diện mạo  
3.3.1 Tổng quan  
Nguyễn Thành Trung  
Mt dng khác ca trích chọn đặc trưng là trích trọn đặc trưng diện mạo để xác định  
những thay đổi trên khuôn mt. Mt số phương pháp tiểu biểu như : Principle  
Component Analsys (PCA) [19], Gabor Wavelet Analysis [1,19] và Local Binary  
Pattern [20,21] và được áp dng trên toàn bbmt bc nh hoc mt phn để trích ra  
các đặc trưng và phát hin sự thay đổi ca khuôn mt  
3.3.2 Mã LBP  
LBP là viết tt ca Local Binary Pattern hay là mu nhị phân địa phương được Ojala  
[29] trình bày vào năm 1996 như là một đơn vị đo độ tương phản cc bca nh.  
Phiên bản đầu tiên của LBP được dùng với 8 điểm nh xung quanh và sdng giá trị  
của điểm nh ở trung tâm làm ngưỡng. Giá trị LBP được xác định bng cách nhân các  
giá trị ngưỡng vi trng số ứng vi mỗi điểm ảnh sau đó cộng tng li.  
Ktừ khi được đưa ra, theo định nghĩa là bất biến vi những thay đổi đơn điệu trong  
ảnh đen trắng. Để ci tiến phương pháp, bổ sung thêm phương pháp tương phản trc  
giao địa phương. Hình dưới minh họa cách tính độ tương phản trc giao (C) là hiu  
cấp độ xám trung bình ca các điểm nh lớn hơn hoặc bằng ngưỡng với các điểm nh  
thấp hơn ngưỡng. Phân phi hai chiu ca mã LBP và độ tương phản cc bộ được ly  
làm đặc trưng gọi là LBP/C.  
19  
     
Chương 3 : Trích chọn đặc trưng trên khuôn mặt  
Nguyễn Thành Trung  
Hình 12 - Ví dụ về LBP và độ tương phản cục bộ C  
Ngun gc  
Dãy LBP được Ojala [29] trình bày vào năm 2002. Định nghĩa một cấu trúc điểm  
nh T là mt phân phối đại sca cấp độ xám của P +1 (P > 0) điểm nh.  
T = t(gc,g0,…,gp-1)  
Vi gc ng vi cấp độ xám của điểm nh trung tâm Ptt , gp (p = 0,..,1) tương ng vi P  
điểm ảnh xung quanh, P điểm nh này nẳm trên đường tròn bán kính R và tâm là Ptt .  
Hình 13 - Tập hợp các điểm xung quanh Ptt.  
Không mt thông tin, có thtrgp đi một lượng là gc  
T = t(gc,g0 gc ,…,gp - gc)  
Gisssai sgia gp và gc là độc lp vi gc, ta có thnhân thóa gc như sau  
T = t(gc)t(g0-gc,…,gp-1-gc)  
t(gc) biu thị xu hướng độ sáng ti ca cbc ảnh nên không liên quan đến kết cu ca  
nh cc bộ do đó có thể bqua  
T~t((g0 - gc),…,(gp-1-gc))  
20  
   
Chương 3 : Trích chọn đặc trưng trên khuôn mặt  
Nguyễn Thành Trung  
Mc dù tính bt biến ngược với độ thay đổi tlxám của điểm nh, skhác bit nh  
hưởng bi tlệ. Để thu được đặc điểm bt biến vi bt kmt sự thay đổi nào ca nh  
đen trắng (gray scale) chỉ quan tâm đến du của độ lch:  
T~t(s(g0 - gc),…,s(gp-1-gc))  
1   0  
Vi s là hàm du s(x) =   
0  < 0  
Trng s2p được dùng cho các hàm du s(gp-gc) để chuyn skhác bit giữa các điểm  
nh bên cnh vmt giá trduy nht.  
p
=01       * 2  
 
LBPP,R  
=
Theo Eq.2 cP pixel thì có 2p giá trLBPP,R trong khong [0,2p – 1] nhưng để đơn  
p
2  
,  
gin ta có thchn mt sgiá trtrong 2 giá trký hiu là 퐿퐵푃  
Nguyên lý phân lớp không tham biến  
Trong phân lớp, sự khác biệt giữa mẫu và mô hình phân phối LBP được đánh giả  
bởi kiểm tra thống kê không tham biến.Phương pháp tiếp cận này có ưu điểm là không  
cần phải có những giả thiết về phân phối của các đặc trưng.  
Thông thường, những kiểm tra thống kê được chọn cho mục đích là nguyên lý cross-  
entropy được giới thiệu bởi Kullback (1968). Sau đó, Sokal và Rohlf (1969) gọi cách  
đo này là thống kê G.  
푆푏  
 
 
G(S,M) = 2* =1 푆푏 log  
= 2 =1[푆푏  푙표푔푆  푆푏  푙표푔푀푏]  
푀푏  
Vi S,M kí hiu phân phi mu và mô hình mong mun. Sb và Mb là xác suất đề b  
thuc vào phân phi mu hoc mô hình . B là sphn ttrong phân phi.  
Thng kê G sdng trong phân lp có thviết lại như sau.  
 
L(S,M) =  =1 푆푏 log Mb  
Kiến trúc mô hình có thể xem như xử lý ngẫu nhiên có đặc tính có thể xác định bi  
phân phi LBP. Trong mt phân lớp đơn giản , mi lớp được biu din bi mt mô  
hình phân phối đơn giản Mi . Tương tự , mt kiến trúc mẫu không xác định có thể  
miêu tbi phân phi S. L là mt gima trận đo khả năng mẫu S có ththuc lp i.  
21  

Tải về để xem bản đầy đủ

pdf 67 trang yennguyen 03/05/2025 100
Bạn đang xem 30 trang mẫu của tài liệu "Khóa luận Trích chọn đặc trưng trên khuôn mặt người", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfkhoa_luan_trich_chon_dac_trung_tren_khuon_mat_nguoi.pdf