Khóa luận Xử lý ảnh và ứng dụng theo dõi đối tượng chuyển động

ĐẠI HC QUC GIA HÀ NI  
TRƯỜNG ĐẠI HC CÔNG NGHỆ  
Lê Anh Vũ  
XNH VÀ NG DNG THEO DÕI ĐI TƯỢNG  
CHUYN ĐNG  
KHÓA LUN TT NGHIP ĐẠI HC CHÍNH QUY  
Ngành : Công Nghệ Đin T- Vin Thông  
HÀ NI 2005  
ĐẠI HC QUC GIA HÀ NI  
TRƯỜNG ĐẠI HC CÔNG NGHỆ  
Lê Anh Vũ  
XNH VÀ NG DNG THEO DÕI ĐI TƯỢNG  
CHUYN ĐNG  
KHÓA LUN TT NGHIP ĐẠI HC CHÍNH QUY  
Ngành : Công Nghệ Đin T- Vin Thông  
Cán bhướng dn : Nguyn Vinh Quang  
HÀ NI 2005  
Li cm ơn  
Để hoàn thành được khóa lun này đó là sgiúp đỡ nhit tình và hết sc to  
điu kin ca các thy cô và nhà trường cùng các bn trong lp , Stn tình và  
cm thông ca gia đình,anh em.  
Em xin chân thành cm ơn thy Nguyn Vinh Quang, người đã hưỡng dn  
em làm khóa lun này, thy đã nhit tình giúp đỡ em trong sut quá trình làm  
khóa lun vcvt cht ln tinh thn.  
Em xin cm ơn Nhà Trường và đặc bit là các thy cô ca khoa Đin Tthuc  
Phòng Thí Nghim ROBOTIC ca Trường, nhng người mà hàng ngày vn to điu  
kin và bo ban em.  
Cm ơn các bn lp K46DC, nhưng người luôn sát cánh và chia scùng  
mình!  
Hà Ni, ngày 05/06/2005  
Mc lc  
Mở đầu…………………………………………………………………………….1  
Phn 1: LÝ THUYT XNH …………………………………………….2  
Chương 1: Lý Thuyết xnh …………………………………………………2  
1.1:Thu nhn nh và shóa…………………………………………………2  
1.2:Phân tích nh…………………………………………………………….2  
1.3:Quyết định………………………………………………………………..3  
Chương 2: Thu nhn hình nh…………………………………………… …...3  
2.1:Thu nhn nh…………………………………………………………….3  
2.2:Lưu nh…………………………………………………………………..7  
Chương 3: Phân tích nh……………………………………………………….…8  
3.1:Khái nim pixel và pixil lân cn…………………………………………8  
3.2:Mt scông ctrgiúp xnh………………………………………8  
3.2.1:Tích chp………………………………………………………………..8  
3.2.2:Kthut lc s……………………………………………………….11  
3.2.3:Biến đổi Fourier……………………………………………………….. 11  
3.3:Tin xlý…………………………………………………………………16  
3.3.1:Phương pháp tin xlý trong min không gian……………………..16  
3.3.2:Phương pháp tin xlý trong min tn s………………………...17  
3.4:Làm trơn nh………………………………………………………….…18  
3.4.1:Ly trung bình các đim nh lân cn, lc tuyến tính………………..18  
3.4.2:Phương pháp lc trung v…………………………………………..19  
3.4.3:Trung bình hóa hình nh……………………………………………...19  
3.4.4:Làm trơn hình nh nhphân………………………………………….20  
3.5:Phát hin biên…………………………………………………………….22  
3.6:Lp ngưỡng………………………………………………………………25  
Phn 2: PHN THC NGHIM:……………………………………………….....26  
Chương 1: Ngôn nglp trình……………………………………………...28  
Chương 2:Điu khin công LPT trên Win200/NT/XP…………………….31  
Chương 3:Minh ha thut toán và chương trình………………………….34  
Tài liu tham kho:………………………………………………………………….52  
TÓM TT NI DUNG KHÓA LUN:  
Ni dung ca khóa lun là ng dng lý thuyết ca xnh squa thiết bthu nh , ở  
đây là web camera để điu khin mt hcơ tự động theo dõi đối tượng chuyn động.  
Khóa lun được chia làm hai phn chính, phn lý thuyết và phn thc nghim :  
-Trong phn lý thuyết , ta stìm hiu các khái nim cơ bn ca xnh s,  
bao gm lý thuyết vXnh,Thu nhn hình nh và Phân tích nh.  
-phn này, gii thiu các khái nim vxnh và ng dng các thut toán  
vxnh như là công ctoán hc tích chp, các phưong pháp tin xlý : lc nhiu,  
phát hin biên, phân ngưỡng nh….  
-Phn thc hành gm 3 phn:  
Phn 1 tìm hiu ngôn nglp trình và thư vin AVICap ca Microsoft.  
Phn 2 sgii thiu vcách giao tiếp và điu khin công LPT trên VC++.  
Phn 3 là phn chính , bao gm thut toán và chương trình chính điu khin.  
LI MỞ ĐẦU  
Trong my thp kgn đây, xnh đã được nghiên cu mnh mđã có  
rt nhiu g dng trong thc tế. Như trong y hc, xnh số đã được dùng để phát  
hin và nhn dng khi u , ci thin nh X quang , nhn dng đường biên mch máu  
tnhng nh chp mch bng tia X. trong cuc sng gia đình, xnh được dùng để  
ci thin nh Ti vi. Trong truyn thông video như hi nghvideo, đin thoi video thì  
mt vn đề chính là cn có gii tn rng. Vic mã hóa thng các chương trình video  
cht lượn qung bá cn đến 100 triu bit/s. Điu này không thể đáp ng được.Nhưng  
bng cách mã hóa svà khôi phc nh (là nhng vn đề ca xnh ) thì vic trên  
có ththc hin chvi băng tn 100 nghìn bit/s. Còn trong lĩnh vc khoa hc kỹ  
thut, xnh đã và đang có nhng đóng góp quan trng, đặc bit là trong lĩnh vc  
Robot. Robot thông minh ngày nay không ththiếu yếu txnh. Đó là các vn đề  
nhn dng các đối tượng ngoài môi trường. Tvic nhn dng có thgii quyết rt  
nhiu bài toán như tránh vt cn, dò đường....Xnh có thể được chia ra làm các  
quá trình sau: Thu nhn hình nh, phân tích nh và quyết định.  
Mô hình sn phm theo dõi đối tượng dùng camera .  
PHN 1: LÝ THUYT XNH  
CHƯƠNG 1 : HTHNG XNH  
Mt hthng xnh đin hình được cho trên hình vsau:  
Lưu  
trữ  
Lưu trữ  
Thiết bthu nhn  
nh (Camera.  
Thu nhn  
nh  
Phân tích  
nh  
Nhn  
dng  
Shoá  
Sensor)  
Hquyết định  
Hình 1.1, Các giai đon chính trong xnh.  
Thình v1.1 ta thy mt hthng xnh bao gm thu nhn nh, shóa  
nh, phân tích nh và cui cùng là quyết định (tùy thuc vào yêu cu ng dng cụ  
thđưa ra quyết định cho phù hp)  
1.1 Thu nhn nh và shóa  
Vic thu nhn nh có ththông qua camera. Các camera có thhoc là tương tự  
(loi camera ng kiu CCIR) hoc là s(loi camera kiu CCD_ Charge Coupled  
Device). nh cũng có thể được thu qua các thiết bkhác như máy quét v..v . Nếu nh  
nhn được là tương tnó phi được shóa nhquá trình ly mu và lượng thóa  
trước khi phân tích, xlý hay lưu trữ ảnh.  
1.2 Phân tích nh  
giai đon này nh được xlý theo nhiu công đon nhnhư: ci thin nh, khôi  
phc nh để làm ni bt mt số đặc tính chính ca nh hay làm nh gn vi trng thái  
gc. Tiếp theo là phát hin các đặc tính như biên, phân vùng.  
1.3 Quyết định  
Cui cùng tùy theo mc đích ca ng dng, slà giai đon nhn dng hay các  
quyết định khác.  
CHƯƠNG 2: THU NHN HÌNH NH  
2.1 Thu nhn nh  
Để thu nhn nh người ta thường dùng các camera truyn hình, các camera gm  
tube hoc sensor mch rn và các thiết bị đin tử đi kèm. Camera sensor mch rn  
có mt số ưu đim so vi camera tube như nhhơn, nhhơn, bn hơn, bn hơn và  
tiêu thcông sut thp hơn. Tuy nhiên, mt scamera tube có độ phân gii cao  
hơn camera sensor mch rn. Mt trong snhng loi được sdng phbiến ca  
camera tivi là Vidicon.  
Camera Vidicon là mt vkính hình lăng trcha mt súng phóng electron ở đầu  
và mt màn hình (faceplate) ở đầu kia. Dòng electron được hi tvà làm lch đin  
áp đặt vào các cun dây như trên hình v2.1. Mch làm lch làm cho dòng electron  
quết lên bmt trong ca màn hình để đọc” hình nh . Bmt bên trong ca màn  
hình được phmt màng mng kim loi trong sut, màng mng này to thành mt  
đin cc mà từ đó to ra tín hiu đin ca hình nh. Mt lp nhy sáng được phủ  
trên màng mng kim loi. Lp to thành bao gm nhng qucu trkháng có kích  
crt nh, trkháng ca nhng qucu này tlnghch vi cường độ sáng ca  
nó.. Phía sau lp nhy sáng đó có mt lưới tích đin dương để gim tc các  
electron được phát ra tsúng phóng electron sao cho khi các electron này ti bề  
mt đích vcơ bn vn tc là bng không.  
chế độ hot động bình thường, đin áp dương được đặt vào lp kim loi ca màn  
hình. Khi không có ánh sáng, lp nhy sáng đóng vai trò như cht đin môi, dòng  
electron phmt lp electron lên bmt bên trong ca màn hình để cân bng vi  
đin tích dương trên lp kim loi. Khi chùm electron quét bmt ca màn hình,  
lp nhày sáng trth ành mt tụ đin vi đin tích âm trên bmt phía trong và đin  
tích dương bmt đối din. Khi ánh sáng va vào màn hình, trkháng ca nó  
gim và el ectron được phép chuyn động tdo và trung hòa vi đin tích dương.  
Vì lượng đin tích chuyn động tdo tl vi ánh sáng trong mt vùng cc bbt  
kca màn hình, hiu ng này t o ra mt hình nh trên màn hình ging vi nh  
chiếu trên màn hình ca tube. Nghĩa là, stp trung ca c ác đin tích electron là  
cao trong các vùng ti và thp hơn trong các vùng sáng. Khi dòng electron quét  
màn hình ln thhai nó thay thế các đin tích bmt, và do đó to thành mt dòng  
đin chy trong lp kim loi và phía ngoài ca mt trong các chân tube. Dòng  
này tlvi selectron được thay thế và do đó tl vi cường độ sáng ti vtrí  
cthca dòng quét. Sthay đổi này khi dòng electron quét sto ra mt tín hiu  
hình nh tlvi cường độ ca nh đầu vào.  
Cun hi tdòng electron:  
Lp nhy sáng  
Lưới  
Các chân tube  
Dòng electron  
Súng phóng electron  
Màn hình  
Lp phkim loi trong sut  
Cun làm lch dòng electron  
Hình 2.1.Sơ đồ mt vidicon  
Hình 2.2 Mu quét dòng electro
Hình 2.2 minh ha mt chun quét.Dòng electron quét toàn bmàn hình 30 ln  
mi giây, mi mt vết quét hoàn chnh (gi là mt khung) gm 525 dòng trong đó có  
480 dòng cha thông tin vhình nh. Nếu các dòng được quét mt cách tun tvà kết  
quả được hin thlên mt màn hình TV, hình nh snhp nháy rõ rt. Có thkhc  
phc hin tượng này bng cách sdng cơ cu quét mà trong đó mi khung được chia  
ra thành hai trường mành xen knhau, mi trường gm 2625 dòng và được quét 60 ln  
trong mt giây hay tc độ khung tăng lên gp đôi. Trường hp đầu tiên ca mi khung  
quét các dòng l(là các đường chm chm trong hình 2.2) trong khi đó mành thhai  
quét các dòng chn. Sơ đồ quết này được gi chun là RETMA (Radio-Electronics  
Television Manufacturers Association ). Hip hi các hãng chế to Radio, Tivi, và  
máy móc đin t). Các chun khác có tc độ dòng trên mi mành cao hơn , nhưng về  
cơ bn nguyên lý hot độn4g ca các mch này là ging nhau.  
Các thiết bCCD gm hai loi: Sensor quét dòng và sensor khi. Thành phn cơ  
bn ca Sensor CCD quét dòng là mt hàng phân tử ảnh silic gi là photosites. Các  
photo hình nh cho qua mt cu trúc cng đa tinh thtrong sut và được hp thụ  
trong tinh thsilic, do đó to nên mt cp lelectron. Các quang đin tto ra  
được tp hp vào các photosite, lượng đin tích được tp hp trong mi photosite  
tlvi cường độ chiếu sáng ti đim đó. Mt sensor quét dòng đin hình gm  
mt hàng các phân tử ảnh photosite, hai cng truyn được sdng để cht li ni  
dung ca các phn thình nh vào các thanh ghi vn chuyn và mt cng ni ra  
được sdng để cht ni dung ca các thanh ghi vn chuyn vào bkhuyếch đại,  
li ra ca bkhuyếch đại này là mt tín hiu đin áp tlvi các ni dung ca  
hàng photosites.  
Thanh ghi vn chuyn  
Cng  
Li  
Ra  
C
ng  
Bộ  
khuếch  
đại  
Các thanh  
Ghi điu khin  
N Photosites  
2 1  
.
.
.
.
Li ra  
C
ng  
Thanh ghi truyn  
Hình 2.3.Sensor quét dòng CCD  
Các mng khi ghép din tích ging các sensor quét dòng, ngoi trcác photosite  
được sp xếp theo dng ma trn và có mt thp thanh ghi vn chuyn cng gia  
các ct photosite như trong hình 2.4. Ni dung ca các photosite lẻ được cht ln  
lượt vào các thanh ghi vn chuyn dc và sau đó li được cht vào các thanh ghi  
vn chuyn ngang. Ni dung ca các thanh ghi vn chuyn ngang này được dn  
vào bkhuyếch đại, li ra ca bkhuyếch đại là mt dòng lhình nh. Thc hin  
tương tvi các photosite chn để hoàn thành trường thhai ca khung TV. Cơ  
cu quét này được lp li 30 ln mi giây.  
Các camera quét dòng chcho ra mt dòng hình nh ca hình nh li vào. Nhng  
thiết bnày đặc bit phù hp cho các ng dng mà các đối tượng chuyn động qua  
sensor (như trong các băng truyn) . Schuyn động ca mt đối tượng theo hướng  
vuông góc vi sensor to ra hình nh hai chiu. Các sensor quét dòng độ phân gii  
thp 32x3, trung bình 256x256 và cao 480 phân tử ảnh và các sensor thí nghim CCD  
có khnăng đạt được độ phân gii khong 1024x1024 hay cao hơn.  
Ở đây, ta ký hiu nh li ra hai chiu ca camera hay thiết bcho nh khác là  
f(x,y) trong đó x, y biu thtoạ độ không gian (ví dmt phng nh) và giá trf ti  
đim (x,y) bt ktlvi toạ độ (cường độ sang) ca hình nh ti đim đó . Hình 2.5  
minh homt đim nh và quy ước toạ độ ca nó.  
Hình 2.5. Quy ước toạ độ cho biu din hình nh Giá trca đim nh (x.y) bt kỳ  
được cho bi giá tr(cường độ sáng) ca f ti đim đó.:  
Gc hình nh  
y
f(x,y)  
x
Để máy tính có thxlý, hàm nh (x,y) phi được shoá cvkhông gian ln  
biên độ (cường độ). Vic shoá các toạ độ không gian (x,y) được coi như là vic ly  
mu hình nh, trong khi đó vic shoá biên độ được coi là lượng thoá cường độ cho  
nhng hình nh đơn sc và phn nh bn cht ca các nh này là biến thiên từ đen ti  
trng theo các mc xám khác nhau. Hai thut ngcường độ sang và mc xám có thể  
dung hoán chuyn cho nhau.  
Gismt hình nh liên tc được ly mu đồng nht cho mt mng N hang và M  
ct, ở đây mi mu cũng được lượng thoá vbiên độ. Mng này được gi là nh s,  
có thể được viết như sau:  
[
f
(
0,0  
)
f
(
o,1  
)
.................... f  
(
0,m 1  
)
]
f
(
1,0  
)
f
(
1,1 ....................... f  
)
(
1, M 1  
)
F(x,y) =  
(2.1)  
................................................................  
f
(
N 1,0 N 1,1 ........ f N 1, M 1  
)
f
(
)
(
)
ở đây các biến ri rc:x=0, 1, 2 …, N-1  
y= 0, 1, 2, …, M-1  
Mi phn ttrong mng được gi là mt phn tử ảnh hay pixel. Tmng ta thy  
pixel ti gc ca nh được biu thlà f(0,0), pixel bên phi là f(0,1), v.v. Thông thường  
N, M và smc cường độ ri rc ca mi pixel đã lượng thoá là lutha nguyên  
ca 2.  
2.2 Lưu nh.  
Để lưu trữ ảnh trên máy tính, mt số định dng nh đã được nghiên cu như  
IMG, PCX, TIFF, GIF.  
Định dng nh IMG dung cho nh đen trng. Phn đầu ca nh IMG có 16 byte  
cha các thông tin:  
6 byte đầu: dung để đánh du định dng nh IMG. Giá trca 6 byte này được  
viết là 0x0001 0x0008 0x0001.  
2 byte tiếp theo: cha độ dài mu tin. Đó là độ dài ca dãy các byte klin nhau  
mà dãy này sẽ được lp li mt sln nào đó. Sln lp li này sẽ được lưu  
trong byte đếm. Nhiu dãy ging nhau được lưu trong mt byte. Đây là mt  
cách lưu trhình nh dưới dng nén.  
4 byte tiếp theo: mô tkích cpixel  
2 byte tiếp theo: cho biết spixel trên mt dòng nh  
2 byte cui: cho biết sdòng nh trong nh.  
Định dng nh PCX là mt trong nhng định dng nh cổ đin nht. Định dng  
này sdng phương pháp mã loi dài RLE (Run-Length-Encoded) để nén dliu nh.  
Quá trình nén và gii nén được thc hin trên tng dòng nh. Tp PCX gm 3 phn :  
đầu tp(header), dliu nh (image data), và bng màu mrng.  
Định dng nh TIFF được thiết kế để làm nhbt các vn đề liên quan đến vic  
mrng tp nh cố định. Định dng này cũng gm 3 phn: IFH, IFD, DE.  
Định dng nh GIF (Graphics Interchange Format). Định dng này được đưa ra  
để khc phc nhng vn đề mà các định dng nh khác gp phi khi smàu trong nh  
tăng lên. Định dng tng quát ca nh GIF được cho trên hình v2.6  
Hình 2.6 Định dng tng quát GIF ca mt hình nh.:  
GIF note  
GIF header  
Global Palette  
Header image (_10 byte)  
Palette of image 1 (nếu có)  
Data of image 1  
‘’ Ký tliên tiếp  
………………………..  
‘’ GIF terminator  
CHƯƠNG 3: PHÂN TÍCH NH  
3.1 Khái nim pixel và pixel lân cn  
Pixel là phân tnhnht cu to nên hình nh. Mi pixel có mt toạ độ ̣(x,y) và  
màu xác định.  
Hình 3.1 Pixel P và các lân cn ca P  
P1  
P2  
P3  
̣
(x-1, y-1)  
P4  
(x-1, y)  
P
(x-1, y+1)  
P5  
̣(x, y-1)  
P6  
(x, y)  
P7  
(x, y+1)  
P8  
(x+1, y-1) (x+1, y)  
(x+1, y+1)  
Mt pixel p ti các toạ độ ̣(x, y) có ô pixel lân cn theo chiu dc và chiu ngang,  
và toạ độ tương ng ca các pixel này , như hình v3.1 là:  
P2(x-1, y)  
P6(x+1, y-1) .  
P7(x+1, y)  
P5(x, y+1)  
Tp các pixel này gi là lân cn ca p và ký hiu là N4(p). Mi pixel lân cn cách  
(x, y) mt đơn vvà nếu (x, y) mép ca màn hình thì scó mt spixel lân cn ca p  
nm ngoài hình nh.  
Ngoài 4 pixel lân cn ca p theo chiu dc và chiêu ngang, xung quanh p còn có  
4 pixel chéo góc có các toạ độ tương ng là:  
P1(x-1, y-1)  
P6(x+1, y-1)  
P3(x-1, y+1)  
P8(x+1, y+1)  
Tp các pixel này được ký hiu là NḌ(p).Bn pixel này cùng vi 4 pixel trên  
to thành 8 pixel lân cn cup và được ký hiu là N8 (p) .Tp hp này cũng scó mt  
spixel bên ngoài hình nh nếu (x, y) nm mép ca hình nh.  
3.2 Mt scông ctrgiúp xnh  
3.2.1 Tích chp  
Toán ttích chp được định nghĩa như sau:  
Trường hp liên tc:  
g(x,y) = h(x,y) ⊗ f(x,y)  
= ∞  
h
(
x x', y y'  
)
f
(
x', y'  
)
dx'dy' h(x-x`,y-y`) f(x`,y`) dx` dy`  
(3.1)  
−∞  
−∞  
Trường hp ri rc:  
y(m,n) = h(m,n) ⊗ x(m,n) =  
h
(
m m',n n'  
)
x
(
m',n'  
)
(3.2)  
∑ ∑  
−∞  
−∞  
n’  
n’  
Xoay180o  
C
x (m’, n’)  
h (m’, n’)  
B
m
h(m-m’, n-n’)  
m’  
C
m’  
n
A
a) Đáp ng xung  
b) Tín hiu ra vtrí (m,n)  
Hình 3.2 Mt biu din ca toán ttích chp  
Ví d:  
Cho các ma trn:  
+ Ma trn tín hiu :  
1 4 1  
2 5 3  
+ Ma trn đáp ng xung:  
1
1
1 1  
Ma trn tích chp ca x và h là mt ma trn 4x3. Nói chung chp ca hai ma trn số  
(M1xN1) (M2xN2) là mt ma trn c(M1+M2, N1+N2 -1). Quá trình nhân chp ca h và x  
được minh hotrong hình 3.3 sau:  
1 4 1  
2 5 3  
n
n
-1  
1
1
1
1
4
1
1
a) x(m,n)  
b) h(m,n)  
c) h(-m,-n)  
-1 1  
1 1  
-2 5  
0 0  
1 5 5 1  
3 10 5 2  
2 3 -2 -3  
d) h(1-m,-n)  
e) y(1,0) = -2+3=1  
f) y(m,n)  
Hình 3.3 . Ví dvtoán tnhân chp  
Tích chp là mt khái nim rt quan trng trong xnh, đặc bit là tính cht  
ca nó có liên quan đến biến đổi Fourier: Biến đổi Fourier ca mt tích chp bng tích  
đơn gin các biến đổi Fourier ca tín hiu đó:  
F[H (x,y) ⊗ I(x,y)] = F [H (x,y) , F[I(x,y)]  
̣(3.3)  
Trong kthut H(x,y) được gi là nhân chp hay nhân cun hay mt n: I(x,y) gi  
nh đối tượng.  
Thut toán tng quát để tính nhân chp dùng cho mi trường hp. Để sdng thut  
toán chcn thay đổi hai thông s:ma trn biu din nh scn xlý và ma trn  
biu din nhân chp.  
Nhân chp (ImageIn, ImageOut: nh H: nhân chp N: kích thước nh W; kích  
thước nhân chp)  
{ Vào: ImageIn  
Nhân chp  
Ra: ImageOut}  
Begin  
For i = 1 to N do  
For i = 1 to N do  
Begin  
Sum = 0  
Le:= (w+1) div2:  
For k:=1 to w do  
For k:=1 to w do  
Begin  
Col:=1-k+Lc;  
R ow:=j+l+Lc  
If(Col<> 0 and (Col<=N) then  
If(Row <> 0 and (Row <=N) then  
Sum:=Sum+ImageIn [Col, Row ] * H [k,l]  
End;  
ImageOut [i,j] = Sum  
End;  
End;  
3.2.2 Kthut lc số  
Cht lượng hình nh kém do rt nhiu nguyên nhân như do nhim đin tca máy  
thu hay cht lượng bshóa kém. Nhiu nh số được xem như là sdch chuyn  
nhanh ca tín hiu thu nhn trên mt khong cách ngn. Vmt tn s, nhiu ng  
vi các thành phn tn scao trong nh. Như vy để xlý nhiu ta có thlc các  
thành phn tn scao. Vic lc da vào tính dư tha thông tin không gian ; các  
pixel lân cn có thcó cùng hoc gn cùng mt số đặc tính. Kthut lc này dùng  
mt mt nvà di chuyn khp nh gc. Tùy theo cách thp đim đang xét vi các  
đim lân cn mà ta có kthut lc tuyến tính hay kthut lc phi tuyến. Đim nh  
chu tác động ca biến đổi là đim tâm ca mt n. Các kthut lc này được  
trình bày ktrong phn làm trơn nh.  
3.2.3 Biến đổi Fourier  
3.2.3.1 Khái nim và công thc  
Biến đổi Fourier cho mt tín hiu có thbiu din như sau:  
FT  
x(t)  
X(f)  
Min thi gian  
Min tn số  
Dng phc  
X(n )  
X(z)  
Biến đổi Fourier thun cho tín hiu mt chiu gm mt cp biến đổi  
-Biến đổi Fourier thun: chuyn sbiu din tkhông gian thc sang không gian tn  
s(phvà pha) . Các thành phn tn sn ày đ ược gi là các biu din trong không  
gian Fourier ca tín hiu.  
- Biến đổi Fourier ngược: Chuyn đổi sbiu din ca đối tượng tkhông gian  
Fourier sang không gian thc.  
a)Không gian mt chiu.  
Cho mt hàm f(x) liên tc. Biến đổi Fourier ca f(x), ký hiu F(u) , u biu din  
tn skhông gian , được định ngh ĩa l à:  
F(u) =  
ƒ(x)e-2jπ ux dx  
(3.4)  
−∞  
Trong đ ó:  
F(x) : biu din biên độ tín hiu  
e-2jπ ux: biu din pha.  
Biến đổi Fourier ngược ca F(u) cho f(x) đ ược định nghĩa như sau:  
∞  
ƒ(x) =  
F(u)e-2jπ ux du  
−∞  
(3.5)  
−∞  
b) Không gian hai chiu  
Cho f(x,y) là hàm biu din nh liên tc trong không gian hai chiu, cp biến đổi  
Fourier được định nghĩa như sau:  
-Biến đổi Fourier thun:  
∞  
F(u,v) =  
f(x,y) e-2jπ (ux+vy) dxdy  
(3.6)  
−∞ −∞  
U,v biu din tn skhông gian  
-Biến đổi Fourier ngược  
f(u,v) = ∞  
F(x,y) e-2jπ (ux+vy) dxdv  
(3.6)  
−∞ −∞  
3.2.3.2 Biến đôFourier ri rc_DFT  
Biến đổi DFT được phát trin da trên bi ến đổi Fourier cho nh s. Ở đây, tích  
phân được thay bng tng. Biến đổi Fourier DFT t ính các giá trca biến đ ổi  
Fourier cho mt t p các giá trtrong không gian tn số được cách đều.  
a) DFT cho tín hiu mt chiu  
Vi tín hiu mt chiu, người ta biến đổi bi mt chui trc giao các hàm cơ s.  
Vi các hàm liên tc, khai trin chui trc giao scung cp chui các hsùng  
trong nhiu quá trình khác nhau hay trong phân tích hàm. Khai trin Fourier ri rc  
DFT cho mt dãy {u(n), n=0,1,....N} được định nghĩa bi:  
N 1  
V(k) =  
u(v) Wkn  
v i k=0, 1,....., N-1  
(3.7)  
N
n=0  
vi WN = e-j2π/N  
và biến đổi ngược  
N 1  
1
-kn  
u(n) =  
v (k)WN  
vi k=0,1,….N-1 (3.8)  
N
k=0  
Thc tế trong xnh người ta hay dung DFT đơn v:  
N 1  
1
kn  
v(k)=  
u(n)=  
u(k)WN  
u(k)WN  
vi k=0,1,….N-1 (3.9)  
vi k=0,1,….N-1 (3.10)  
n=0  
N 1  
N
1
-kn  
N
n=0  
Các DFT và DFT đơn vcó tính đối xng. Hơn na khai trin DFT và DFT đơn vị  
ca mt chui và biến đổi ngược li ca nó có tính chu kvà chu kN.  
b) DFT cho tín hiu hai chiu (nh s)  
DFT hai chiu ca mt nh MxN:{u(m,n)} là mt biến đổi tách được và được định  
nghĩa:  
N 1 N 1  
km  
ln  
V(k,l) =  
u(m,n) WN WN  
vi 0 1,kN-1 (3.11)  
∑∑  
m=0 n=0  
Và biến đổi ngược:  
N 1 N 1  
N1 ∑∑  
-km  
-ln  
V(k,l) =  
v(k,l) WN WN vi 0 m,nN-1 (3.12)  
m=0 n=0  
Cp DFT đơn vhai chiu được định nghĩa:  
N 1 N 1  
N1 ∑∑  
km  
ln  
V(k,l) =  
(3.13)  
u(m,n) WN  
WN  
vi 0 1,kN-1  
vi 0 m,nN-1  
m=0 n=0  
N 1 N 1  
N1 ∑∑  
-km  
-ln  
U(m,n) =  
(3.14)  
v(k,l) WN  
WN  
m=0 n=0  
Viết li các công thc (3.13) và (3.14) ta có:  
N 1  
N1 ∑∑  
(km +ln)  
V(k,l) =  
u(m,n) =  
u(m,n)WN  
vi 0 m,nN-1  
(3.15)  
m=0  
0
N 1 N 1  
N1 ∑∑  
-(km +ln)  
v(k,l)WN  
Vi 0 m,nN-1 (3.16)  
m=0 l=0  
Ở đây, WN(km +ln) là ma trn nh cơ s.  
Ta có: WN-(km +ln) =e-j2π(km+ln)/N =cos [2π(km+ln)/N] -jsin [2π(km+ln)/N]  
Như vy các hàm cơ strong ma trn cơ sca biến đổi Fourier là các hàm cosine  
và hàm sine. Chbiến đổi Fourier biu din nh trong không gian mi theo các hàm  
sine và cosine.  
3.2.3.3. Định lý chp cun hai chiu.  
DFT ca cun chp hai chiu ca hai ma trn bng tích DFT ca chúng:  
N 1 N 1  
u(m,n) =  
h(m-m’, n-n’)c u1(m’,n’)  
vi 0 m,nN-1  
(3.17)  
∑∑  
m=0 l=0  
vi h(m,n), u1(m,n) là ma trn NxN và h(m,n)c =h(m mod N, n mod N)  
3.2.3.4. Thut toán biến đổi Fourier nhanh.  
- Trường hp mt chiu  
N 1  
1
kn  
Tcông thc v(k) =  
u(n) WN  
vi k= 0,1,…., N-1 ta thy vi mi giá  
N
n=0  
trk ta cn N phép tính nhân và N phép cng. Nên để tính N giá trca v(k) ta phi  
tính N2 phép tính. Để khc phc điu này người ta sdng thut toán biến đổi Fourier  
nhanh FFT chcn N.log2N phép tính.  
Thut toán Fourier nhanh được tóm tt như sau:  
-GisN=2n  
-GisWN là nghim thN ca đơn vWN =e-2jπ/N và M=N/2 ta có:  
2M 1  
1
nk  
v(k) =  
u(n)W2M  
(3.18)  
2M  
n=0  
- Khai trin công thc trên ta được  
M 1  
1
1
2nk  
v(k) = (  
u(2n) W2M  
+
u(2n+1) W2M(2n+1)k)/2  
(3.19)  
M
M
n=0  
vì W2M2nk =W2Mnk, do đó:  
1
v(k) = [uchn (n)+ul(n)]  
(3.20)  
2
v(k) vi k=[0,M-1] là mt DFT trên M =N/2. Thc cht ca thut toán FFT là dung  
nguyên tc chia đôi và tính chu kỳ để tính DFT. Vi k=[0,M-1] dung công thc (3.19).  
Vi k=[M,M-1] dung phép trtrong công thc (3.19) có thdung thut toán này để  
tính DFT ngược.  
-Trường hp hai chiu:  
Do DFT hai chiu là tách được nên tcông thc (3.14) ta có:  
N 1  
N 1  
1
kn  
ln  
V(k,l) =  
WN  
u(m,n) WN  
(3.21)  
N
m=0  
n=0  
Tcông thc (3.21) , cách tính DFT hai chiu như sau:  
-Tính DFT 1 chiu vi mi giá trca X (theo ct)  
-Tính DFT 1 chiu theo hướng ngược li (theo hàng) vi giá trthu được trên.  
3.3 Tin xlý  
Có hai phương pháp cơ bn được sdng trong tin xnh. Phương pháp thứ  
nht da vào các kthut tin xlý trong min không gian và phương pháp thứ  
hai sdng các khái nim trong min tn sthông qua biến đổi Fourier.  
3.3.1 Phương pháp tin xlý trong min không gian.  
Thut ngmin không gian ở đây mun nói đến slượng pixel to nên mt hình  
nh. Các phương pháp tin xlý trong min không gian là các thtc tác động trc  
tiếp lên các pixel to lên hình nh đó. Các hàm tin xlý trong min không gian có  
thể được viết như sau:  
g(x,y) =h[f(x.y)]  
(3.22)  
Ở đây f(x,y) là hàm đim nh chưa được xlý.  
g(x,y) là hàm đim nh đã được xlý.  
h là toán táp lên f. Dng đơn gin nht ca h là lân cn có kúch tghước1x1, khi  
đó g chphthuc vào giá trca f ti (x,y) và h trthành hàn ánh xcường độ  
sáng đim nh.  
Mt trong nhng kthut được sdng rng rãi nht là sdng mt nnhân  
chp. Trên hình 3.4 minh homt mt nlà mt mng 2 chiu có kích thước 3x3,  
các hsca mt nạ được chn để phát hin mt thuc tính cho trước trong mt  
hình nh.  
Hình 3.4. Mt lân cn kích thước 3x3 quanh đim (x,y)  
y
(x,y)  
x
Để hiu rõ vmt nnhân chp ta xét mt ví dcthsau. Gischúng ta có  
mt hình nh có cường độ không đổi cha mt số đim nh tách ri nhau, cường độ  
ca các đim nh này khác vi nn. Các đim nh này có thể được phát hin bng mt  
mt nnhân chp có kích thước 3x3 vi các hsố đã chn trên hình 3.5  
Hình 3.5. Mt ndung để xác định các đim nh  
Tách bit trên mt nn không đổi  
-1  
-1  
-1  
-1  
8
-1  
-1  
-1  
-1  
Thtc phát hin đim nh như sau: Cho tâm ca mt nchuyn động xung quanh  
hình nh. Ti mi vtrí pixel trong hình nh, ta nhân mi pixel nm trong vùng mt  
ntương ng ; Nghĩa là pixel tâm ca mt nạ được nhân vi 8, còn 8 pixel lân  
cn được nhân vi –1. Sau đó cng kết quca 9 phép nhân này li. Nếu tt ccác  
pixel trong mt ncó cùng giá tr(tc nn không đổi), thì tng sbng 0. Ngược  
li nếu tâm ca mt ntrùng vi mt trong các đim nh cn xác định, thì tng sẽ  
khác 0. Nếu đim nh cn xác định không nm đúng tâm ca mt n, tng cũng sẽ  
khác 0, nhưng giá trbiên độ ca đáp ng syếu hơn. Nhng đáp ng yếu hơn này  
có thloi bbng cách so sánh tng vi mt ngưỡng.  
Xét mt mt ncó các hsw1, w2,….w9 và 8 đim nh lân cn ca đim nh  
(x,y) như hình 3.6. Ta có thkhái quát hoá mt hàm tin xlý cho mt mt n3x3  
như sau:  
h[f(x,y)]= w1f(x-1, y-1) +w3f(x-1, y+1) +w4f(x, y-1) +w5f(x,y)+w6f(x,y+1)  
+w7f(x+1,y-1)+w8f(x+1,y) +w9f(x+1, y+1)  
(3.23)  
Hình 3.6. Mt ntng quát kích thước  
3x3 trình bày các hsvà vtrí pixel  
nh tương ng.  
W1  
(x-1,y-1)  
W4  
W2  
(x-1,y)  
W5  
W3  
(x-1,y+1)  
W6  
hình  
(x, y-1)  
W7  
(x,y)  
W8  
(x,y+1)  
W9  
(x+1, y-1) (x+1, y)  
(x+1,  
y+1)  
3.3.2 Phương pháp tin xlý trong min tn s.  
Thut ngmin tn số ở đây có nghĩa là tng spixel phc được to ra tvic ly  
biến đổi Fourier hình nh . Khái nim “tn s” thường được sdng trong gii  
thích biến đổi Fourier và suy ra tbn cht ca biến đổi Fourier là thp ca các  
hàm sin phc. Phương pháp naỳ đóng vai trò rt quan trng trong lĩnh các vc như  
phân tích chuyn động ca mt vt và miêu tvt.  
Xét các hàm ri rc ca mt biến, f(x), x=0, 1, …., N-1. Biến đổi Fourier thun ca  
hàm f(x) là:  
N 1  
1
F(u) =  
f(x)e-2jπux / N  
(3.24)  
N
x=0  
vi u = 0, 1, 2,…..N-1. Trong phương trình này j=-1 và u gi là biến tn s. Biến đỏi  
Fourier ngược cho li f(x) được định nghĩa như sau:  
N 1  
(3.25)  
f(x) =  
F
(
u
)
e2jπux / N  
u=0  
Nếu tính trc tiếp tcác phương trình (3.24) và (3.25) vi u=x=0,1, 2, ...N-1 thì  
phi thc hin khong N2 phép cng và phép nhân. Sdng thut toán biến đổi  
Fourier nhanh cho phép gim đáng kslượng phép tính xung còn N.log2 N phép  
tính, ở đây N được gislà mt snguyên mũ 2.  
Cp biến đổi Fourier hai chiu ca hình nh NxN được định nghĩa như sau:  
N 1 N 1  
1
F(u,v) =  
f(x,y)e-j2π (ux+vy)/N  
(3.26)  
(3.27)  
∑  
N
x=0  
y=0  
vi u,v=0,1,2..., N-1 và  
N 1 N 1  
1
f(x,y) =  
F(u,v)ej2π (ux+vy)/N  
∑ ∑  
N
u=0  
v=0  
vi x,y=0, 1, 2,...N-1.  
Bng cách coi biên ca vt như mng mt chiu các đim, sau đó tính biến đổi  
Fourier các phn tca mng đó, tcác giá trF(u) thu được có thbiết được dng  
biên ca vt. Biến đổi Fourier mt chiu cũng là mt công crt mnh trong vic  
phát hin chuyn động ca vt. Tuy vn còn hn chế vmt tính toán nhưng biến  
đổi Fourier ri rc có rt nhiu ng dng trong các lĩnh vc tái to nh, ci thin  
nh và khôi phc nh. Đối vi biến đổi Fourier liên tc, hai chiu, vic tính toán có  
thể đạt ti tc độ ánh sáng nhsdng các thiết bquang hc .  
3.4 Làm trơn nh.  
3.4.1 Ly trung bình các đim nh lân cn- Lc tuyến tính.  
Ly trung bình các đim nh lân cn là mt kthut min không gian đơn gin để  
làm trơn nh. Cho mt hình ành f(x,y) , thtc sto ra mt hình nh đã làm trơn  
g(x,y), cường độ ti mi đim (x,y) ca nh này có được bng cách ly trung  
bình các giá trcường độ các đim nh ca f nm trong mt lân cn xác trước định  
ca (x,y). Nói cách khác, nh đã được làm nhn có được bng cách sdng  
phương trình:  
1
G(x,y) =  
f(n,m)  
(3.28)  
p (  
n,m S  
)
vi mi x,y nm trong f(x,y) , S là tp hp ta độ các đim trong lân cn (x,y) gm cả  
(x,y) và P là tng số đim trong lân cn.  
3.4.2. Phương pháp lc đim gia (lc trung v)_ Lc phi tuyến.  
Mt trong nhng khó khăn chyếu ca phương pháp ly trung bình các đim nh  
lân cn là nó làm mbiên ca hình nh và các chi tiết sc nét khác. Smnày có  
thlàm gim đáng knhvic sdng blc đim gia ở đây chúng ta sthay  
cường độ ca mi đim nh bng độ ln cường độ ca đim gia trong mt lân cn  
xác định trước ca đim nh đó thay vì ly trung bình các đim nh.  
Để thc hin lc đim gia trong mt lân cn ca mt đim nh, trước tiên phi sp  
xếp các giá trca pixel và các lân cn ca nó, xác định đim gia và gán giá trị  
này cho pixel. Ví d: trong lân cn 3x3 đim gia là giá trln nht th5, trong  
lân cn 5x5 đim gia là giá trln nht th13v.v…Khi trong lân cn có nhiu giá  
trging nhau, ta nhóm các giá trbng nhau như :gismt lân cn 3x3 có các  
giá tr(10,20,20,20,15,20,20,25,100). Các giá trnày được sp xếp như  
sau(10,15,20,20,20,20,25,100) và các đim gia ca lân cn này là 20 Như vy  
thc cht ca vic lc đim gia là ép các đim có cường độ khác bit ging các  
lân cn ca nó hơn, tc làm loi bcác đim nhn cường độ xut hin trong các  
mt nlc.  
3.4.3 Trung bình hoá hình nh  
Xét mt hình nh nhiu g(x,y) to ra do cng nhiu n(x,y) vào hình nh f()x,y tc  
là:  
G(x,y) = f(x,y) +n(x,y)  
(3.29)  
ở đây gisnhiu là không tương quan và có giá trtrung bình bng 0. Mc tiêu ca  
phương pháp trung bình hoá là to ra mt hình nh tt hơn bng cách cng các hình  
nh nhiu cho trước gi(x,y), i=1,2,…K .  
Nếu nhiu thomãn các ràng buc nêu trên, bài toán sđơn gin và hình nh  
g(x,y) được to ra bng cách ly trung bình K hình nh nhiu khác nhau.  
K
1
g (x,y) =  
g(x,y)  
(3.30)  
(3.31)  
K
i=1  
do đó ta có:  
E { g (x,y)} = f(x,y)  
Và :  
2
1
2
σ (x,y) =  
σ
(x,y)  
(3.32)  
2
g
K
n
2
ở đây E { g (x,y)} là giá trmong đợi ca g , σ (x,y), và σ (x,y) là các biến ca g và  
g
n
n ti toạ độ (x,y). Độ lch chun ti bt kỳ đim nào trong hình nh trung bình được  
cho bi:  
1
σ
(x,y) =  
σ
(x,y) (3.33)  
g
n
K
3.4.4 Làm trơn hình nh nhphân  
Trong nh nhphân đim đen được quy định là 1 và đim trng được quy định là 0.  
Vì hình nh nhphân có hai giá trnhiu trong trường hp này to ra các hiu ng  
như biên mp mô, các lnh, thiếu góc và các đim btách ra.  
Ý tưởng cơ bn là kim tra mt hàm BOOL đối vi lân cn tâm ti pixel p và gán p  
là 1 hoc 0 phthuc vào ssp xếp vmt không gian và giá trca các pixel lân  
cn. Do hn chế vthi gian xlý nên vic phân tích chgii hn trong 8 lân cn  
ca p, lân cn này cho mt mt nkích thước 3x3 như hình 3.7.  
Hình 3.7. Các lân cn ca p sdng để làm nhn nh  
a
d
f
b
p
g
c
e
h
nhphân đim ti là mt và đim sang là 0  
Làm nhn nh nhphân được tiến hành theo các bước sau:  
1. bxung các lnhỏ  
2. bxung các khc trong các cnh  
3. Loi bcác đim 1 bit lp  
4. loi bcác biếu nhdc các cnh  
5. bxung các góc thiếu  
Hai quá trình làm nhn đầu tiên được thc hin bng cách dung biu thc Bool sau:  
Bi =p+b.g.(d+e) +d.e(b+g)  
(3.34)  
ở đây “.” “+” ln lượt là ký hiu ca AND và OR. Theo qui ước, pixel trong mt  
nạ được gán là 1 và pixel trng được gán là 0. Do đó nếu Bi =1, p được gán là 1, ngược  
li p được gán là 0. Phương trình (3.34) được áp dng đồng thi cho tt ccác pixel,  
trong đó giá trtiếp theo ca mi vtrí pixel được xác định trước khi các pixel khác đã  
bthay đổi.  
Bước 3,4 được thc hin tương tbng cách đánh giá biu thc Bool sau:  
B2 =p{(a+b+c). (e+g+h)+(b+c+e).(d+f+g)}  
(3.35)  
đồng thi cho tt ccác pixel . Và p=1 nếu B2 =0.  
Các đim thiếu góc phi trên được bxung bng biu thc sau:  
B= p (d.f.g) .(a + b + c + e + h) +p  
(3.36)  
ở đây du gch trên cho biết phn bù logic. Tương t, các đim thiếu góc phi dưới  
trái trên, và trái dưới được bsung bng các biu thc:  
B= p (a.b.d) .( f + g + c + e + h) +p  
B= p (e.g.h) .(b + a + c + d + f ) +p  
(3.37)  
(3.38)  
Và  
B= p (b.c.e) .(g + a + h + d + f ) +p  
(3.39)  
Bn biu thc này thc hin bước 5 ca thtc làm trơn nh:  
Ví dụ  
1
1
1 1 1 1 1 1  
1 1 1 1 1 1 1  
1 1 1 1 1 1  
1 1 1 1 1 1  
1 1 1 1 1 1  
1 1 1 1 1  
1 1  
1 1 1  
1 1 1 1 1 1 1  
1 1 1  
1 1 1 1 1 1  
1 1 1 1 1 1  
1
1
1
1
1
1
1
1
3.9(a) Hình nh gc  
3.9(b) nh sau khi áp dng B1  

Tải về để xem bản đầy đủ

pdf 62 trang yennguyen 11/05/2025 140
Bạn đang xem 30 trang mẫu của tài liệu "Khóa luận Xử lý ảnh và ứng dụng theo dõi đối tượng chuyển động", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfkhoa_luan_xu_ly_anh_va_ung_dung_theo_doi_doi_tuong_chuyen_do.pdf