Đồ án Tìm hiểu bài toán nhận dạng kí tự viết tay và phát triển ứng dụng

Đồ án tốt nghiệp:  
" Tìm hiểu bài toán nhận dạng kí tự viết  
tay và phát triển ứng dụng”  
  
Nhn dng kí tviết tay và phát trin ng dng  
LI NÓI ĐẦU  
Nhn dng kí t, đặc bit kí tviết tay là bài tn có nhiu ng dng thc  
tin. Vmt lý thuyết, chưa có phương pháp nào hn chnh cho cho bài tn này do  
tính phc tp, sbiến dng ca dliu đầu vào.  
Nhng năm gn đây, cùng vơí sphát trin ca lý thuyết nhn dng, công  
nghxnh, đã có nhiu nghiên cu mang li mt skết qucho bài tn nhn  
dng kí tviết tay, từ đó mra hàng lot ng dng thc tế.  
Mc tiêu ca đồ án nhm gii thiu mt cách tiếp cn bài tn nhn dng  
chviết tay vi mt sràng buc, nhm tng bước đưa vào ng dng thc tin.  
Mc dù hết sc cgng, song do thi gian có hn và nhng hn chế bn  
thân nên đồ án có thcòn thiếu sót, mong tiếp tc nhn được schbo ca Thy,  
Cô và ý kiến đóng góp ca các bn sinh viên để đồ án được hn thin hơn. Em xin  
chân thành cm ơn.  
Nha Trang  
Ngày 10 tháng 9 năm 2003  
SVTH : NguynĐình Cường  
Trang 1  
Nhn dng kí tviết tay và phát trin ng dng  
NHN XÉT CA GIÁO VIÊN.  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
...............................................................................................................................  
Giáo viên nhn xét  
PHN I  
SVTH : NguynĐình Cường  
Trang 2  
Nhn dng kí tviết tay và phát trin ng dng  
TNG QUAN VÀ CƠ SLÝ  
THUYT TIN XNH KÍ TỰ  
CHƯƠNG I  
TNG QUAN  
I. Gii thiu bài tn:  
Nhn dng kí t, đặc bit kí tviết tay là bài tn có nhiu ng dng thc tế.  
Máy tính xlí, nhn dng các biu mu, phiếu điu tra tự động, bng cách này ta  
có thtiết kim được nhiu chi phí vthi gian, công sc cũng như các chi phí  
khác cho vic nhp dliu.  
Ngày nay cùng vi sphát trin vmt lý thuyết, công ngh, có rt nhiu  
hướng đi cho vic gii quyết bài tn này như: nhn dng kí tda trên cu trúc  
hay cách tiếp cn khác như dùng: logic m, gii thut di truyn, mô hình xác sut  
thng kê, mô hình mng nơ ron. Đặc bit trong nhng năm gn đây mô hình mng  
nơron được quan tâm nhiu do khnăng tng hp ca mô hình và sphát trin về  
tc độ xlí ca máy tính.  
Trên thế gii hin nay có nhiu chương trình nhn dng chviết (chin và  
viết tay) bng các thtiếng Anh, Nga, v.v... như các hOMNIPAGE, READ-  
WRITE, WORD-SCAN,... Vit Nam cũng có mt shnhư WORC ca công  
SVTH : NguynĐình Cường  
Trang 3  
Nhn dng kí tviết tay và phát trin ng dng  
ty 3C, VIET-IN ca công ty SEATIC, VNDOCR ca Vin Công NghThông Tin,  
Image Scon ca Trung Tâm Tự Động Hóa Thiết Kế, hWINGIS ca công ty  
DolfSoft...  
Nhìn chung, các sn phm phn mm nhn dng văn bn Tiếng Vit chin  
ca nước ta đã thu được kết qukhquan, đặc bit phn mm VNDOCR đã được  
sdng rng rãi trong các cơ quan nhà nước. Riêng phn nhn dng kí tviết tay  
vn đang được nghiên cu và phát trin nhm phc vcho các yêu cu khác nhau  
như đọc và xlý các biu mu: hố đơn, phiếu điu tra ...  
Vi mc tiêu tìm hiu bài tn nhn dng nh kí tviết tay không trc tuyến  
(off-line), đồng thi sdng kết quvào vic xlí phiếu đăng kí môn hc ca  
Trường Đại Hc ThuSn Nha Trang. Ni dung đồ án là sthnghim xây dng  
chương trình nhn dng nh kí tviết tay nêu trên, bng cách sdng mng nơron  
để nhn dng kí t, da trên tp mu kí tự đã được mã hbi đặc trưng ca đường  
biên.  
Trong quá trình tìm hiu lý thuyết và xây dng chương trình, em đã tham  
kho nhiu ngun tài liu, trong đó ý tưởng xác định véc tơ đặc trưng ca kí tự  
viết tay sdng trong đồ án này được tham kho tlun án thc sĩ “ Nhn dng  
chviết tay ri Tiếng Vit”, ca tác giPhm Đại Xuân, Đại hc khoa hc tự  
nhiên Thành PhHChí Minh.  
II. Cu trúc, ni dung ca đồ án:  
Ni dung ca đồ án được chia làm 4 phn:  
Phn I: Gii thiu tng quan và cơ slý thuyết tin xnh kí t, gm  
3 chương:  
Chương 1: Gii thiu tng quan.  
Chương 2: Gii thiu cơ slí thuyết tin xnh kí t.  
Chương 3: Gii thiu cách xác định đặc trưng ca kí t.  
Phn II: Gii thiu các mô hình nhn dng, gm 2 chương.  
Chương 1: Gii thiu mt skĩ thut phân lp: đối sánh, sdng  
hàm thế, phương pháp LDA.  
Chương 2: Gii thiu mô hình mng nơ ron cho bài tn nhn dng.  
Phn III: Gii thiu mt số ứng dng và đánh giá kết lun gm 4  
chương .  
Chương 1: Gii thiu ng dng kĩ thut tách liên thông cho vic  
tách liên thông kí ttrong văn bn.  
Chương 2: Xây dng, đánh giá chương trình nhn dng kí tviết  
tay.  
Chương 3: Đưa kết quvào ng dng xây dng chương trình xlí  
phiếu đăng kí môn hc cho sinh viên trường Đại hc ThuSn Nha  
Trang.  
Chương 4: Đánh giá kết lun và nêu hướng phát trin ca đề tài.  
Phn IV : Phlc gii thiu giao din chương trình.  
SVTH : NguynĐình Cường  
Trang 4  
Nhn dng kí tviết tay và phát trin ng dng  
CHƯƠNG II  
CƠ SLÝ THUYT TIN XNH KÍ TỰ  
I. Lc mn nh:  
Lc mn nh là mt lc thông thp, giá trca mt đim nh là trung bình  
trng sca các đim nh lân cn, hay giá trị đim nh là kết quca quá trình  
xon (convole) ca các đim nh lân cn vi mt nhân. Nhân có kích thước tuý  
3x3, 5x5, kích thước nhân càng ln thì càng nhiu đim lân cn nh hưởng vào  
đim nh kết qu. Ví dmt snhân lc mn nh như sau:  
1 1 1  
1 1 1  
1 1 1  
1/9  
1 1 1  
1 2 1  
1 1 1  
1/10  
1 1 1  
1 4 1  
1 1 1  
1/12  
Lc mn nh có tác dng hn chế ảnh nhiu mui tiêu.  
II. Nhphân nh:  
Nhphân nh mc xám là tìm giá trngưỡng sao cho các đim nh có giá  
trln hơn ngưỡng được gi là trng(nn) và các đim nh có giá trnhhơn  
ngưỡng được gi là đen (đối tượng).  
Tiêu chun xác định ngưỡng thường sdng nht là sdng sai sbình  
phương trung bình gia giá trmu v và mc tái thiết r(v). (ký hiu MSE)  
Ta có:  
  
   
v r v p v dv  
   
2
2
E
e2  
=  
   
E v r v  
  
0
Trong đó p(v) là hàm mt độ xác sut ca biến ngu nhiên v, có thcoi xp  
xbng histogram ca nh. Vi mt scho trước L các mc xám MSE được biu  
din bi:  
j1  
E
e2  
v vj 2 p  
v  
dv  
j
SVTH : NguynĐ
Trang 5  
Nhn dng kí tviết tay và phát trin ng dng  
Do r(v)=rj là hng strong đon [vj , vj+1].  
Vi p(v) cho trước và smc tái thiết L cố định, các mc quyết định vj ,  
j= 1…L-1 và các mc tái thiết rj , j=0..L-1 cc tiu hMSE tuân theo quan hsau:  
rj1 rj  
vj   
rj   
j 1...L 1  
j 1..L 1  
2
v j 1  
   
vp v dv  
v j  
v j 1  
p
v
dv  
Tuy nhiên, không có cách gii quyết dưới dng khép kín nào tn ti trkhi  
v j  
chp nhn mt sphép xp x.  
Bây gita xem xét trường hp ngoi lnhưng quan trng vi L=2. Đó là  
trường hp nhphân hố ảnh. Khi đó MSE trthành:  
v1  
v2  
E
e2  
v r0  
2 p  
v  
v r1 2 p  
v
dv  
  
dv   
v0  
v1  
Gisrng p(v) có thể ước lượng thistogram và v0, v2 tương ng vi  
vmin, vmax. Còn li ba tham scn được tính tn đó là r0, r1, và v1. Tham sv1 gi là  
ngưỡng nhphân h. Hơn na r0(v1) và r1(v1) cc tiu MSE, vi mt giá trcho  
trước ca vj, đơn gin là nhng giá trtrung bình trong đon tương ng:  
v1  
vp  
v  
dv  
v0  
r0  
v1  
v1  
p
v  
dv  
v0  
v2  
vp  
v  
dv  
v1  
r1 v1  
v2  
p
v  
dv  
v1  
Như vy đc tính bng cách thay r0 và  
r1 bng r0(v1) và r1(v1) tương ng và chn vlsao cho MSE là cc tiu.  
Otsu đề nghmt cách tương tnhưng tiêu chun đơn gin hơn vmt tính  
tn da trên phân tích bit s. Trong công thc này, MSE tương đương vi  
2
2
phương sai lp trong W (v1). Nếu W (v1) được bsung vào phương sai lp gia  
SVTH : NguynĐình Cường  
Trang 6  
Nhn dng kí tviết tay và phát trin ng dng  
2
2
B (v1), ta được tn bbiến đổi T ( độc lp v1). Như vy, thay vì cc tiu MSE,  
gii thut ca Otsu cc đại phương sai gia lp:  
2
2
v1* argmax  
p0  
v1  
0  
v1  
T  
p1  
v1  
1  
v1  
T  
Trong đó:  
p0  
p1  
v1  
v1  
v1  
 
1  
v1  
v1  
v1  
0  
v1  
v1  
v1  
T  
1  
1  
v1  
Và  
T  
v2 vmax  
v1  
v1  
v  
dv  
p  
v0  
v1  
   
   
v vp v dv  
1
v0  
Biu thc ành :  
2   
T .  
v1  
 
v1  
  
v* arg max  
1
v1  
1  
v1  
Tht ra, còn tn ti mt stiêu chun lượng hkhác, chng hn entropy,  
cũng trên histogram ca mc xám. Histogram có thể được tính ttn bộ ảnh hoc  
tlân cn địa phương gii hn xung quanh nh đang xét.  
III. Đánh nhãn thành phn liên thông:  
Khái nim liên thông trong kí tcó thxem như tp hp các đim nh lin  
nhau to nên kí t, mc tiêu ca gii thut này là lc ra nhng kí tcó trong nh.  
1. Tách liên thông bng kĩ thut đệ quy :  
Để tách liên thông ta nghĩ ngay đến kthut đệ quy cp 8 (ti mi bước  
chúng ta có ti đa 8 la chn tiếp theo).  
Quy ước : Đim (x, y) : cho biết giá trị đim ti toạ độ (x, y).  
=1 màu chữ  
=0 màu nn  
Height : Chiu cao nh  
Width : Chiu rng nh  
Ta có gii thut như sau:  
// Đưa tt ccác đim liên thông vi Đim(x,y) vào liên thông t  
Procedure Chonvao((x,y) :đim, t :liênthông)  
Begin  
If (Đim(x, y)=1) AND (NOT đã_xét[x,y]) then  
Begin  
Them_vao_lien_thong(t,(x, y));  
SVTH : NguynĐình Cường  
Trang 7  
Nhn dng kí tviết tay và phát trin ng dng  
Đã_xét[x, y] :=True ;  
For i :=x-1 to x+1 do  
For j:= y-1 to y+1 do  
If ( i <>x) or (j<>y) then Chonvao((i, j),t);  
End;  
End ;  
// Ta có thtc tách liên thông đệ quy như sau :  
Procedure TáchLiênThôngĐQ(VAR LT: Danh_Sách_Liên_Thông)  
Begin  
T:=<danh sách rng>  
t:=<liên thông rng>  
For j:=1 to Height do  
For i:=1 to Width do đã_xét[i, j]:=False;  
For j:=1 to Height do  
For i:=1 to Width do  
If (Đim(x, y)=1) AND( NOT Đã_xét[i, j]) then  
Begin  
Chonvao( (i, j ),t);  
Thêm _liên_thông_vào_Danh_Sách(T, t) ;  
t :=<liên thông rng> ;  
End ;  
End;  
Nhn xét:  
Thut tn này chcó ý nghĩa minh hobn cht ca tách liên thông. Ta  
không chn thut tn này cài đặt vì chi phí đệ quy quá cao, chưa ktc độ thc  
hin.  
2. Gii thut ci tiến:  
Để gán nhãn cho thành phn liên thông ta có thduyt theo tng đường  
chy. Kthut này gán cho mi thành phn liên thông ca nh nhphân mt nhãn  
riêng bit. Nhãn thường là các stnhiên bt đầu tmt đến tng scác thành  
phn liên thông trong nh input.  
Gii thut phát biu như sau:  
Quét nh ttrái sang phi và ttrên xung dưới. Trong dòng thnht cha  
pixel đen, mt nhãn duy nht được gán cho mi đường chy liên tc ca pixel đen.  
Vi mi pixel đen ca dòng tiếp theo, các pixel lân cn dòng trước và pixel bên  
trái được xem xét (hình va ). Nếu bt kì pixel lân cn nào được gán nhãn, nhãn  
tương tự được gán cho pixel đen hin thi; ngược li, nhãn tiếp theo chưa được sử  
dng được chn. Thtc này được sdng cho đến dòng cui ca nh.  
Lúc kết thúc tiến trình này, mt thành phn liên thông có thcha các pixel  
có các nhãn khác nhau vì khi chúng ta xem xét lân cn ca pixel đen, chng hn  
pixel “?” (trong hình c), pixel đối vi lân cn trái và nhng lân cn trong dòng  
trước có thgán nhãn mt cách riêng bit. (Trong ví dnày, chúng ta sdng  
nhãn ca lân cn trái). Mt tình hung như vy phi được xác định và ghi li. Sau  
SVTH : NguynĐình Cường  
Trang 8  
Nhn dng kí tviết tay và phát trin ng dng  
tiến trình quét nh, vic gán nhãn được hn tt bng cách “thng nht mâu thun  
các nhãn và gán li các nhãn chưa sdng.  
Để minh hota có các hình biu din sau:  
. . . . .  
. P P P .  
. L ? . .  
. . . . .  
Hình a. lân cn ca “?” P= dòng trước; L=lân cn trái  
. . . . . . . . . . . . . .  
. . . . . . . . . . . . . .  
.
. .  
. .  
.
. . . .  
.
. .  
. .  
. . . .  
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
1
1
1
1
1
1
2
2
2
*
2
2
2
2
. .  
.
. . .  
. . .  
*
. . .  
. .  
.
. . .  
.
. . .  
*
*
*
1
1
2
2
. . .  
.
. . .  
*
*
*
*
*
1
1
1
2
2
2
. . . . . .  
?
. . . . . .  
*
*
*
*
1
1
*
.
. . .  
. .  
.
. . .  
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
. . . . . . . .  
. . . . . . .  
. . . . . . . . . . .  
. .  
. . . . . . . .  
. .  
*
*
*
*
*
*
*
*
*
.
.
. .  
.
.
. . . . . . .  
. . . . . . . . . . .  
. .  
*
*
*
*
*
*
Hình b . Aûnh ban đầu  
Hình c . Tiến trình gán nhãn  
. . . . . . . . . . . . . .  
. . . . . . . . . . . . . .  
.
. .  
. .  
.
. . . .  
.
. .  
. .  
. . . .  
1
1
1
1
1
1
1
1
1
1
2
2
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
. .  
.
. . .  
. . .  
. . .  
. .  
.
. . .  
.
. . .  
2
2
2
2
1
1
1
1
. . .  
.
. . .  
1
2
2
2
2
2
1
1
1
1
1
1
. . . . . .  
. . . . . .  
1
1
1
1
1
1
1
1
1
.
. . .  
. .  
.
. . .  
1
1
1
1
1
1
3
3
3
1
1
1
1
1
2
2
2
. . . . . . . .  
. . . . . . .  
. . . . . . . . . . .  
. .  
. . . . . . . .  
. .  
4
4
4
4
3
3
3
3
3
2
.
.
. .  
.
.
. . . . . . .  
. . . . . . . . . . .  
. .  
4
3
3
2
4
3
Hình d . Sau khi quét đầy đủ  
IV
Hình e .Kết qusau cùng  
Chnh.  
Trước hết ta phi xác định góc nghiêng tng thca đối tượng, và ta dch chuyn  
đim nh đối tượng theo phương ngang tutheo giá trgóc nghiêng tng thnày  
và giá try ca đim này.  
0
+
-  
Chuyn gc toạ độ vtrng tâm nh như hình b  
Góc nghiêng ca kí tự được qui ước tính là góc ttrc tung, hướng vbên  
trái có giá trdương, hướng vbên phi có giá trâm.  
SVTH : NguynĐình Cường  
Trang 9  
Nhn dng kí tviết tay và phát trin ng dng  
Góc nghiêng tng thkí tlà hướng trung bình ca các đim nh đối tượng  
có giá trgóc khong –450 đến 450 theo quy ước tính góc trên . Các đim nh đối  
tượng có hướng ngi khong –450 đến 450 không tính.  
Gisgi là góc nghiêng tng thca kí t, đim nh đối tượng p(x,y)  
(trong htoạ độ mi ) scó toạ độ mi là p(x’ ,y’) (trong htoạ độ mi ) vi :  
x' x tg  
y' y  
 
y  
Để tính góc nghiêng tng thta phi tính được hướng ca các đim nh đối  
tượng. Hướng ti mt đim nh đối tượng được tính nhvào vectơ gradient đim  
nh đó. Vectơ gradient ti mt đim nh (x, y)là:  
f  
x  
f  
G
x   
f   
Gy  
y  
Độ l(x,y) được tính bi:  
f Gx2 Gy2  
Hướng ca vectơ gradient ti(x,y) được tính bi:  
G
y
1  
x, y tan  
Gx  
Gx và Gy là kết quxon (convolve) vi nhân Sobel Sx và Sy:  
-1 -2 -1  
-1 0  
-2 0  
-1 0  
Sx  
1
2
1
0 0  
1 2  
Sy  
0
1
Hình . Các nhân ca blc Sobel  
Chú ý: góc tính theo gradient ti mi đim nh đối tượng là góc so vi trc  
x và chxét nhng đim có hướng ca vectơ gradient thotrong khong [450,1350]  
hay [-1350,-450].  
V. Chun kích thước:  
Chun kích thước nh kí tvmt kích thước cố định và phóng sát bn  
biên ca nh.  
Phóng nh là thc hin phép biến đổi sau:  
fs  
x, y f x sx , y sy  
Vi (x, y) là toạ độ đim nh sau khi phóng và sx ,sy là tlphóng theo trc  
x và y tương ng, fx(x,y) là giá trị đim nh kết quả ứng vi giá trtoạ độ (x, y).  
Chú ý:  
SVTH : NguynĐình Cường  
Trang 10  
Nhn dng kí tviết tay và phát trin ng dng  
Sau khi phóng nh, nh có thbri rc, răng cưa biên. Để khc phc tình  
trng này, ta thc hin mt sxlý bng phép đóng morphology:  
VI. Lp khong trng nh bng phép đóng morphology:  
1. Mt số định nghĩa:  
GisA và B là hai tp trong không gian Z2, aЄ A thì a=(a1, a2)  
Phép dch chuyn ca tp A đối vi x=(x1, x2) ký hiu(A)x , được định  
nghĩa.  
A
x  
c c a x, vôùi aA  
Phép phn chiếu ca tp B, ký hiu B*, được định nghĩa:  
B*   
x x  b, vôùi b B  
Phép bù ca mt tp A, ký hiu Ac, được định nghĩa:  
AC   
x x A  
Hiu ca hai ký hiu A-B, được định nghĩa:  
A B   
x x A, x B  
2. Phép giãn:  
GisA, B là hai tp thuc Z2, là tp hp rng, phép giãn ca A đối vi  
B, ký hiu AB, được định nghĩa:  
*
A B x B A    
x
Tp B thường được gi là thành phn cu trúc.  
3. Phép co:  
GisA, B là hai tp thuc Z2, phép co ca A đối vi B, ký hiu AB  
được định nghĩa:  
AB   
x  
B
x A
  
4. Phép đóng:  
GisA, B là hai tp thuc Z2, phép đóng ca A đối vi B, ký hiu AB  
được định nghĩa:  
AB   
Tc phép đóng là phép do thc hin phép mri thc hin phép đóng lên  
kết quva có.  
A B  
B  
Phép đóng có tác dng làm đầy nhng khong nh(tuthuc vào thành  
phn cu trúc B) thường xy ra trên đường biên.  
Thành phn cu trúc thường được sdng là thành phn cu trúc đối xng  
có gc (0, 0) là tâm như hình:  
0
1
0
1
1
1
0
1
0
SVTH : NguynĐình Cường  
Trang 11  
Nhn dng kí tviết tay và phát trin ng dng  
Nhưng do nh được quét vi độ phân gii 300 dpi, và đối vi nhng chcó  
bng được viết khá nghiêng thì khi thc hin phóng vi thành phn cu trúc trên,  
tc thc hin phép giãn ri thc hin phép co, thì phép giãn làm cho phn bng bị  
dính li vi nhau do vi mi hướng ngang và đứng đều được giãn 2 đim nh. Để  
hn chế điu này ta sdng 2 thành phn cu trúc không đối xng và thc hin  
phép đóng 2 ln trên 2 thành phn cu trúc này, vì khi thc hin phép giãn thì chỉ  
cn giãn v1 phía:  
0
1
0
1
1
0
0
0
0
0
0
0
0
1
1
0
1
0
Các thành phn cu trúc không đối xng.  
VII. Ly đường biên và làm trơn đường biên:  
1. Phát hin biên:  
Biên ca nh được thiết lp bng cách nhân chp nh vi phn tcó cu  
trúc:  
0
1
0
1
1
1
0
1
0
2. Dò biên  mã hố đường biên:  
Ta có gii thut dò tìm biên như sau:  
Bước 1: Quét nh đến khi gp đim nh đen. Gi nó là pixel 1  
Bước 2: Lp  
Nếu ” đim nh hin thi là đen “ thì “dò ngược”  
Ngược li “sang phi” đến khi “gp pixel 1”  
Minh hodò biên  
1 2  
12  
3
5
11  
4
8
6
10 9  
7
SVTH : NguynĐình Cường  
Trang 12  
Nhn dng kí tviết tay và phát trin ng dng  
3. Xác định hướng ca đim biên (Freeman code):  
Các hướng được quy ước như sau:  
2
1
3
4
0
7
5
6
Vi hướng quy ước trên, đường biên được mã hnhư sau:  
4. Làm trơn đường biên:  
Làm trơn đường biên là duyt theo đường biên, nếu hai đim liên tiếp trên  
đường biên có hiu shướng ln hơn 1 thì có thhiu chnh để đường biên mà  
hai đim liên tiếp có hiu shướng bng 1.  
Theo mã hướng Freeman, hiu shướng ca 2 đim liên tiếp nhau trên  
đường biên được định nghĩa :  
Goi ci là mã hướng ti đim biên đang xét pi , ci+1 là mã hướng ca đim kế  
tiếp trên đường biên pi+1  
Đặt d=ci+1-ci và  
Dabs=|d| nếu |d|4  
Và dabs=8-|d| nếu |d|>4  
Ta có các trường hp sau:  
a. dabs1 : Đim biên trơn.  
b. dabs=2 và ci chn, ci+1 chn : bpi+1 và thay hướng pi như sau:  
SVTH : NguynĐình Cường  
Trang 13  
Nhn dng kí tviết tay và phát trin ng dng  
Dabs=2 và ci chn , ci+1 chn  
c. dabs=2 và ci l, ci+1 l: Bpi+1 và thay hướng pi như hình  
Dabs=2 và ci l, ci+1 lẻ  
d. dabs=3 , ci chn, ci+1 lẻ  
e. dabs=3, ci l, ci+1 chn  
SVTH : NguynĐình Cường  
Trang 14  
Nhn dng kí tviết tay và phát trin ng dng  
Minh hoạ ảnh kí tsau quá trình tin xlý.  
Aûnh ban đầu  
nqa n xlý  
CHƯƠNG III  
RÚT ĐẶC TRƯNG  
I. Gii thiu đặc trưng hướng:  
Hướng các đim trên đường biên ca kí tmô tkhá đầy đủ vkí t. Đặc  
trưng ca nh được xác định là hướng ca các đim nh trên biên. Vic chn đặc  
trưng để nâng cao độ chính xác ca bài tn nhn dng là hết sc khó khăn, đòi hi  
rt nhiu thi gian và quyết định rt nhiu đến độ chính xác. Hơn na, do biến  
dng khá ln trong chviết tay nên để hn chế người ta thường chia ô trên nh và  
SVTH : NguynĐình Cường  
Trang 15  
Nhn dng kí tviết tay và phát trin ng dng  
đặc trưng được rút trong các ô đó, vic chn các ô phlp lên nhau cũng không  
ngi mc đích trên.  
II.Chia ô:  
Aûnh kí tsau khi tin xlý kích thước được chun vmn đim nh, nh  
được chia nhthành các ô vuông nhkích thước 88 đim nh như hình:  
n
m
Ht.  
Gom 4 ô kích thước 8x8 thành ô kích thước 16x16, và các ô kích thước  
16x16 này được phlên nhau mt na theo hai hướng ngang và dc. Trên mi ô  
kích thước 16x16 srút đặc trưng theo 4 hướng (00, 450, 900,1350) . Mi ô này  
được chia làm 4 phn theo đim tâm ca ô, phn trung tâm A có kích thước 4x4  
đim nh, phn B có kích thước 8x8 đim nh trừ đi phn A, phn C có kích thước  
12x12 đim nh trừ đi phn B và A, và phn D là phn còn li ca ô có kích thước  
16x16 trừ đi phn C, B và A.  
Ta có hình minh hocác phn A, B, C, D trong mi ô vuông 16x16  
D
C
B
A
SVTH : NguynĐình Cường  
Trang 16  
Nhn dng kí tviết tay và phát trin ng dng  
Đặc trng svùng A, B, C và D tương ng là 4, 3, 2, và 1 . Gi xj là mt  
loi đặc trưng, xj được tính cho mt ô kích thước 16x16 như sau:  
xj=4xj(A) +3xj(B) +2xj(C) + xj(D)  
III. Đặc trưng hướng ca đường biên:  
Aûnh để rút đặc trưng này là nh chcha đường biên. Vi mi ô kích  
thước 16x16 đim nh, ta rút ra 4 đặc trưng xj (j=1, 2, 3, 4), xj được tính như công  
thc trên, x1 là số đim biên có hướng 00 hay(1800), x2 là số đim biên có hướng  
450(hay -1350), x3 là số đim có hướng 900 (hay –900) và x4 là số đim có hướng  
1350 (hay -450).  
Như vy nh kí tsẽ được mô tdưới dng :  
X=(x1, x2, x3, x4…….xn)  
Trong đó n=k*4 , vi k là tng sô vuông 16x16 xếp chng lên nhau.  
PHN II  
CÁC MÔ HÌNH NHN DNG  
SVTH : NguynĐình Cường  
Trang 17  
Nhn dng kí tviết tay và phát trin ng dng  
CHƯƠNG I  
GII THIU CÁC MÔ HÌNH PHÂN LP, NHN DNG  
I. Khái quát tình hình nghiên cu, ng dng lý thuyết nhn dng:  
Lý thuyết nhn dng là mt lĩnh vc khoa hc mi phát trin nhưng đã đạt  
được nhiu thành tu đáng kvlý lun và ng dng trong thc tin, chng tkhả  
năng ca máy tính đin t, có thmô hình hố được mt schc năng tương đối  
phc tp ca trí tucon người.  
Cho đến nay cơ stn hc ca lý thuyết nhn dng được xây dng và phát  
trin đồng thi theo các hướng chính sau đây:  
- Lý thuyết thng kê nhn dng.  
- Lý thuyết cu trúc vnhn dng.  
- Lý thuyết đại svnhn dng.  
Mi lý thuyết nói trên đều có mc đích, đối tượng nghiên cu và phương  
pháp gii quyết vn đề khác nhau.  
Lý thuyết thng kê vnhn dng là mt nhánh phát trin tthng kê tn  
hc, sdng các phương pháp cơ bn ca thng kê tn để nghiên cu vn đề nhn  
dng có yếu tngu nhiên và lượng thông tin đủ ln. Công trình đầu tiên ở  
phương Tây theo hướng này là ca Sebestyen, mi đây hai nhà tn hc Liên Xô  
là Vapnhic và Trecvonenkix đã cho ra mt tài liu khá đầy đủ vvn đề này.  
Lý thuyết cu trúc vnhn dng cho ti nay vn chưa được xây dng hn  
chnh. Các nghiên cu theo hướng này tp trung vào nghiên cu các đối tượng mà  
có thcoi như tp hp các đối tượng sơ cp liên hvi nhau bi mt sliên kết  
chun.  
SVTH : NguynĐình Cường  
Trang 18  
Nhn dng kí tviết tay và phát trin ng dng  
Gn đây, mt snhà tn hc có cgng xây dng cu trúc đại scho đối  
tượng và thut tn nhn dng, nhng công trình này cho thy trin vng ca mt  
lý thuyết đại svnhn dng đang hình thành ngày càng rõ nét .  
Do nhu cu cp bách phi gii quyết các vn đề thc tin hot động sn  
xut, nghiên cu khoa hc kthut hin đại đặt ra, cùng vi các kthut tin hc  
mi phát trin (đặc bit là máy tính đin t), nhiu chuyên gia thuc các lĩnh vc  
hot động khác nhau cũng đã đề xut và sdng các mô hình, thut tn nhn dng  
trên cơ sthc nghim, theo cách tiếp cn heuristic.  
Song song vi vic xây dng cơ slý thuyết nhn dng, các hot động  
nghiên cu ng dng lý thuyết nhn dng cũng tiến hành mnh mvà rng khp  
trên nhiu lĩnh vc khác nhau nhiu nước trên thế gii.  
II. Mt skhái nim vnhn dng:  
1.Nhn dng:  
Mt biu din là giá đỡ (cái mang) thông tin, thường biu din dưới dng  
sau:  
X   
x1, x2 , x3 xn  
Mi xi biu din kết quca mt phép đo. Tp hp các biu din xác định  
X được gi là không gian biu din. Ví dkhông gian vectơ.  
Gii thích mt biu din nghĩa là cho mt kết quchng hn mt cái tên.  
Gis: ta có tp hp các tên là:  
  1 ,2 ,p  
Không gian gii thích là mt tp thocác lut, thao tác nào đấy.  
Mt định danh là mt ánh xca không gian biu din vào không gian gii  
thích.  
: X    
:  
x1 , x ,xn  
 
Mc đ2hin ánh xnày và tìm thut tn để thc hin  
trên tn X. Mt thut tn như vy gi là tn tnhn dng.  
2. Tp mu nhn dng:  
Dliu cho bài tn nhn dng thường được biu din qua tp mu hc T  
vi  
T=(xq, )là tp các cp (dliu - tên).  
3. Độ đồng dng và ddng:  
Là hai chsthường dùng để xây dng trên quan hgn thttrên các cp  
đặc bit khong cách gia hai đối tượng là mt chsddng thomãn 3 tiên đề:  
- (x, y)0 , (x, x)=0  
- (x, y)= (y, x)  
- (x, z) (x, y)+ (y, z)  
4. Khong cách đối tượng:  
SVTH : NguynĐình Cường  
Trang 19  
Nhn dng kí tviết tay và phát trin ng dng  
Các hàm đặc trưng quan sát có thdn đến mt quan hgn thtgia 1  
đối tượng X và các khái nim Ai, nghĩa là vi mi i, j có ththiết lp mt quan  
h:  
(X, Ai) (X, Aj)  
Quan hnày thường được thiết lp nhmt khong cách đối tượng, ký  
hiu: D(X, A).  
Nếu mun phân lp hoc định danh X có thdùng thông tin này. GisCi  
là lp phân hoch tương ng vi khái nim đại din Ai ; X được gán vào Ci nếu  
D(X, Ai) là nhnht.  
III. Mt sthut tn phân lp:  
Có nhiu gii pháp phân lp, trong thi gian qua em đã tìm hiu và thử  
nghim mt sgii pháp sau:  
1. Xếp lp khong cách cc tiu:  
Githiết là mi lp mu được biu din bng mt vectơ đơn (hoc trung  
bình).  
1
mj   
x
j 1,2,M  
N j  
xj  
Trong đó Nj là svectơ mu tlp j, M là slp cn phân bit và tng  
được xác định tcác vectơ này, cách xác định lp ca mt vectơ mu x chưa biết  
là chỉ định nó cho lp đơn điu gn nht. Dùng khong cách Euclid để xác định  
độ gn sgim được tính tn.  
   
Dj x x mj ; j 1, 2,M  
Trong đó  a =(aTa )1/2 là dng Euclid. Sau đó ta chỉ định x cho lp j nếu  
Dj(x) là khong cách ngn nht. Đó là khong cách ngn nht dùng trong biu  
din. Ta ddàng nhìn thy nó tương đương vi vic đánh giá bng hàm số  
1
d j  
x
xT mj mTj mj j 1, 2,M  
2
Và chjjsln nht.  
2. Thut tn hàm thế:  
Phương pháp nhn dng theo hàm thế được ng dng nhiu trong thc tin.  
Vic sdng hàm thế được được xut phát tnghĩa thế đin trong trường đin t:  
Trong không gian có đin tích q ti A thì xung quanh nó có đin trường  
theo mi phía. Ti đim M ca không gian ta có thế gây ra bi q là:  
q
r 2  
M  
a.  
a : hng số  
q: độ ln đin tích q  
r: khong cách tM ti q  
Các dng hàm thế thường dùng trong thut tn nhn dng:  
SVTH : NguynĐình Cường  
Trang 20  
Nhn dng kí tviết tay và phát trin ng dng  
s, s'  
S, S'  
S, S'  
e  
1
C1 C2 .  
S,S '  
Ở đây , C1, C2 là các hng scho trước. (S, S) là khong cách S và S’  
(=0, 1, 2..)  
Cách tính thế đối vi mi lp:  
1
S, K j  
S, St  
mj  
S K  
t
j
mj: smu ca Kj  
St: mu thuc Kj  
Ta có lut quyết định:  
S K j neáu S, K j arg max  
S, K  
Chú ý :  
Vic tính thế đối vi mi lp, có thbsung trng smu (St) :  
1
S, K j   
S,St .  
St  
mj  
StK j  
Nhn xét:  
Nếu chn là hàm khong cách Euclid thì gii thut hàm thế này gn ging  
vi cách xếp lp theo khong cách cc tiu.  
3. Phương pháp LDA (Linear Discriminant Analysis):  
Phương pháp LDA cho trường hp phân bit 2 lp, LDA stìm mt  
phương chiếu mà phân bit tt nht các mu thuc hai lp khác nhau trong tp  
mu. Gista có mt tp gm n mu hc X bao gm các vectơ ct d chiu:  
T
xi   
x1i , xi2 , xid  
i 1n  
Trong đó n1 mu thuc vlp C1 và nm trong tp con X1, n2 mu thuc về  
lp C2 và nm trong tp con X2.  
Gista có mt vectơ d chiu w, tích vô hướng y=wTx biu din hình  
chiếu ca vectơ x lên phương w. Ta stìm mt phương chiếu w nhm ti ưu hố độ  
phân bit gia các mu thuc 2 lp C1 và C2. Điu này tương đương vi vic gim  
schiu ca vectơ đặc trưng xung còn 1 chiu.  
Ta gi mi, i=1, 2 là trtrung bình ca các mu tương ng vi 2 lp C1 và  
C2.  
1
mi   
x
ni  
xXi  
SVTH : NguynĐình Cường  
Trang 21  
Nhn dng kí tviết tay và phát trin ng dng  
~
Và  
tương ng là trung bình ca các mu được chiếu lên phương w:  
mi  
~
1
1
mi   
y   
wT x wT m  
i
ni  
ni  
yY  
xXi  
i
Trong đó y là hình chiếu ca x lên w. Yi là tp các hình chiếu ca các x   
Xi lên w.  
Ta có thxem  
~
~
là mt độ đo cho tính phân bit gia hai tp Y1  
| m1 m2 |  
và Y2 . Tuy nhiên để được sphân bit tt gia hai tp khi chiếu lên phương w,  
ta cn có độ sai khác gia hai trtrung bình này khá ln hơn so vi độ lch chun  
ni ti ca mi tp ( có thxem như độ rng ca đám mây các mu).  
Thay vì sdng phương sai ca mi tp ta ssdng mt độ đo khác, gi  
độ ri (scatter) cho các hình chiếu ca các mu thuc lp Ci như sau:  
2  
~
~
yY   
si   
y m  
i   
i
Phương pháp LDA stìm giá trw để cc đại hhàm tiêu chun sau đây:  
~
~
| m1 m2 |2  
J(w)   
~2  
~2  
s1 s2  
Để thy J(w) là mt hàm theo w ta định nghĩa các ma trn SB và Sw như  
sau:  
2
S   
(x m )(x m )T  
  
W
i
i
i1 xXi  
SB (m1 m2 )(m1 m2 )T  
SW được gi là ma trn ri ni lp (within-class scatter matrix)  
SB được gi là ma trn ri liên hp (between-class scatter matrix)  
Ta có:  
2  
si =  
(wT x wT m )2  
i
xXi  
=
wT (x m )(x m )T w  
i
i
xXi  
Nên  
T
2
2  
s1 s2 = w SWw  
Tương tta cũng có:  
SVTH : NguynĐình Cường  
Trang 22  
Nhn dng kí tviết tay và phát trin ng dng  
T
2
(m1 m2 ) = w SBw.  
Do đó:  
wT SBw  
wT SW w  
J(w) =  
.
Để xác định w sao cho J(w) cc đại ta cho đạo hàm riêng J(w) theo w bng  
0 kết quta sẽ được:  
SB w = SW w  
Vi là trriêng, gii bài tn tìm trriêng ta scó:  
w SW1 (m1 m2 )  
Đây là kết qutìm được ca phương pháp LDA đối vi trường hp chcó 2  
lp.  
Sau khi đã tìm được w, mi vectơ x cn nhn dng sẽ được xlý như sau:  
ly x trừ đi trung bình ca mu hc ri chiếu lên phương w ta được mt giá trvô  
~
hướng, tính khong cách tgiá trvô hướng này trên mi ca mi lp này chia cho  
2
~
độ lch chun  
lp.  
ta được mt độ đo khong cách tx đến các cm ng vi mi  
i  
(x m)w mi  
i=1..2  
d1   
i  
x sẽ được gán vào lp ng vi cm gn nht.  
Để phân bit được n lp ta xây dng n bphân loi 2 lp theo phương pháp  
nêu trên. Mi bphân loi sphân bit mt lp vi n-1 lp còn li. Nếu mt  
vectơ đầu vào được xếp vào chai lp thì ta ssdng khong cách di nêu trên  
để quyết định nó thuc vào lp nào. Nếu mt vectơ không được xếp vào lp nào  
thì coi như không nhn dng được.  
Phn tiếp theo xin trình bày cách phân lp da trên mô hình mng nơron  
lan truyn ngược, em dành mt chương riêng để gii thiu vmô hình này.  
SVTH : NguynĐình Cường  
Trang 23  
Nhn dng kí tviết tay và phát trin ng dng  
CHƯƠNG II  
PHÂN LP DA TRÊN MNG NƠRON LAN TRUYN NGƯỢC  
Sơ lược vmng nơron MLP (Multi-Layer Perception ) vi thut tn lan  
truyn ngược:  
I. Gii thiu:  
Xét vmt cu trúc, MLP có cu trúc phân lp. Các cung được ni tmt  
nút lp này đến các nút lp kế tiếp. Hai nút trong cùng mt lp thì không kết  
ni vi nhau. Mi nút trong mt lp nhn giá trtcác nút lp lin trước, tng  
hp li theo trng sca cung kết ni và chuyn giá trkết xut ca nó cho các  
nút lp lin sau. Lp đầu tiên nhn giá trtbên ngi vào và được gi là lp  
nhp (input). Các nút trong lp nhp được gi là nút nhp. Lp cui cùng sxut  
ra kết quca mng và được gi là lp xut (output). Các nút trong lp xut được  
gi là nút xut. Các lp còn li được gi là lp n và các nút tương ng được gi  
là nút n.  
SVTH : Ng
rang 24  
Nhn dng kí tviết tay và phát trin ng dng  
Hình minh homô hình mng nơron 4 lp:1 lp nhp, 2lp n và mt lp  
xut .  
Quá trình nhn dng là quá trình ánh xmt mu x tkhông gian các đặc  
trưng vào không gian các lp. Cũng như vy, MLP thc cht là mt hàm ánh xạ  
mt vectơ đầu vào x thành mt vectơ đầu ra z. Hàm này có đặc tính sau:  
1. Nó là hàm phi tuyến (nonlinear) .  
2. Nó có tính n định (stable). Nghĩa là nếu mt giá trx0 được ánh xạ  
thành mt giá trz0 thì mt giá trx1 “gn” vi x0 sẽ được ánh xthành mt giá trị  
y1 gn vi y0. Hay ta có thnói, sai snhánh xthành sai snh. Mng nơron  
cũng có thánh xmt giá trx2 xa x0 thành mt giá try2 gn vi y0 (ánh xạ  
nhiu mt).  
Thc tế mng nơron là mt bmáy ni suy và ngoi suy phi tuyến. Mt  
mng chvi mt lp n là đã có thxp xbt cmt hàm phi tuyến nào thông  
qua mt smu trong tp mu.  
Để đạt được điu này, ta cn luyn mng bng cách thay đổi các trng số để  
ánh xtcác giá trtrong tp mu đến các giá trị đích mong mun. Quá trình  
luyn mng này cn có tp các vectơ mu đầu vào và đầu ra mong mun tương  
ng. Do đó, quá trình hc này là quá trình hc có giám sát.  
II. Hot động:  
Mng nơron MLP chcó thể ở mt trong hai trng thái: trng thái ánh xạ  
và trng thái hc.  
trng thái ánh x, thông tin sẽ được lan truyn tiến tcác nút nhp đến  
các nút xut và mt mu x sẽ được ánh xthành mt kết quz.  
trng thái hc, các trng sca kết ni sẽ được điu chnh theo mt thut  
tn hc để mng có thxp xỉ được mt hàm mong mun nào đó. Thut tn lan  
truyn ngược là mt thut tn hiu qucho quá trình hc ca MLP.  
Tiếp theo đây em xin trình bày chi tiết hơn vhai trng thái này ca mng.  
1. Trng thái ánh x:  
Như đã nói, trng thái ánh x, mi vectơ đầu vào x sẽ được ánh xthành  
mt vectơ kết quz. Quá trình này được thc hin như sau:  
Đầu tiên vectơ mu x sẽ được đưa vào lp nhp. Mi nơron trong lp nhp  
smang giá trca mt thành phn ca x. Các nút nhp skhông tính tn gì cmà  
gi trc tiếp giá trca nó đến các nơron lp tiếp theo. Ti mi nơron ca các  
lp tiếp theo, mt thao tác ging nhau sẽ được thc hin. Đầu tiên nó stính tng  
trng hca tt ccác giá trị được gi ti. Sau đó mt hàm truyn sẽ được áp  
dng trên tng trng hnày để cho giá trxut ca nút này. Hàm truyn có tác  
dng nén giá trca tng trng hvào mt min gii hn nào đó. Giá trnày được  
SVTH : NguynĐình Cường  
Trang 25  
Nhn dng kí tviết tay và phát trin ng dng  
truyn cho các nơron lp kế tiếp. Cthế thông tin được lan truyn cho đến lp  
xut ca mng.  
Để đơn gin ta kho sát mng gm 3 lp: 1 lp vào, 1 lp n và 1 lp xut.  
Thc tế cũng chcn mng 3 lp là đủ để xp xcác loi hàm.  
Đối vi nút n ta có:  
Tng trng gi ti nút j là:  
I
u j a  
a x  
Kết xut ca m0j iji
i1  
y j g(u j ) j 1,...J  
Trong đó I là snút nhp xi, aij là các trng tinput i đến nút n j và a0j là  
trng ngưỡng ca nút n j, g(x) là hàm truyn.  
Đối vi mng K nút xut ta có:  
Tng trng gi ti nút xut k là:  
J
v b b y  
k
0k  
jk  
j
j1  
Kết xut ca mng:  
zk g(vk ) k 1,..K  
Trong đó J là snút n vi các kết xut yj, bjk là các trng trên các cung liên  
kết tnút n j đến nút xut thk, còn b0k là trng ngưỡng ca nút xut thk,  
g(vk) là hàm truyn theo k.  
Ta có sơ đồ thhin các thao tác được thc hin ti mi nơron.  
M
- Hàm sigmoid (hay hàm logistic) được xác định bi:  
1
f (x)   
1eax  
SVTH : NguynĐình Cường  
Trang 26  
Nhn dng kí tviết tay và phát trin ng dng  
1
0.8  
0.6  
0.4  
0.2  
-6  
-4  
-2  
2
4
6
Hình vẽ đồ thhàm logistic (a=1). Min giá trca hàm là(0, 1).  
- Hàm tanh (tan- hyperbol)  
ex ex  
f (x)   
ex ex  
1
0.5  
-4  
-2  
2
4
-0.5  
Đồ thh-1
Hàm này có min giá trtương ng là (0, 1) và (-1, 1). Vic sdng hàm  
logistic (a=1) hay hàm tanh thc ra là tương đương vi nhau vì chúng liên hệ  
tuyến tính vi nhau. Vic sdng các hàm truyn khác nhau có liên hvi các  
khong giá trkhác nhau ca trng s. (Thc tế cho thy, hàm tanh thường cho  
tc độ hi tnhanh hơn trong quá trình hc ).  
Các hàm truyn có thể được áp dng vào các nút xut hoc không tuvào  
mc đích ánh xca mng. Nếu ta cn có mt sgii hn nht định đối vi đầu  
ra, ta sáp dng mt hàm truyn thích hp cho các nút xut.  
Khi mng nơron được ng dng cho nhn dng thì quá trình nhn dng  
chính là quá trình ánh xca mng nơron.  
2. Trng thái hc:  
Xét mng MLP có mt lp n vi thut tn lan truyn ngược.  
SVTH : NguynĐình Cường  
Trang 27  
Nhn dng kí tviết tay và phát trin ng dng  
Thut tn lan truyn ngược là thut tn hu hiu cho quá trình hc ca  
MLP. Thut tn này scp nht trng sda trên mt hàm li E gia kết xut ca  
mng vi giá trị đích.  
Mc đích ca vic hc có giám sát bng MLP là cc tiu hhàm li này.  
Kthut cơ bn để cc tiu hhàm li là phương pháp gim gradient. Mc dù  
phương pháp này có thdn đến mt cc tiu cc b, nhưng nó được áp dng  
rng rãi vì tính đơn gin ca nó. Thc tế cũng cho thy trong hu hết trường hp  
phương pháp gim gradient đều cho kết quchp nhn được.  
Quá trình hc ca mng MLP theo thut tn lan truyn ngược slp đi lp  
li các thao tác sau:  
- Lan truyn tiến : tính kết xut y ca mng vi mt mu x.  
- Lan truyn ngược : tính sai sgia kết xut y và giá trị đích t và lan  
truyn ngược sai snày li để cp nht trng scho mng.  
Quá trình hc sdng khi mng đã đạt được mt độ li nhnht định.  
a. Phương pháp gim gradient:  
Phương pháp gim gradient gm các bước chính sau:  
- Chn ngu nhiên mt đim x0 trong không gian trng s.  
- Tính độ dc ca hàm li ti x0.  
- Di chuyn đim x0 theo hướng dc nht ca hàm li.  
Quá trình tính độ dc và di chuyn đim x0 được lp đi lp li cho đến khi  
x0 tiến đến giá trlàm cho hàm li cc tiu (có thlà hàm li cc tiu địa phương).  
b. Cp nht trng stheo phương pháp gim gradient:  
Phương pháp cp nht trong stheo hướng gim gradient sda trên đạo  
hàm riêng phn ca hàm li E đối vi trng số đang xét theo công thc sau:  
E  
wij  
wij (t 1) wij (t)   
(t)  
trong đó:  
t là chsca ln cp nht trng shin ti.  
được gi là hshc (learning rate).  
w là mt trng sbt kì trong mng: aij hoc bij  
Công thc trên có thdin dch như sau: cp nht li trng stheo hướng  
ngược hướng ca gradient vi độ dài vectơ dch chuyn phthuc vào độ ln  
ca vectơ đạo hàm.  
Nếu trng số được cp nht theo hướng ngược vi gradient mt độ dch  
chuyn va phi, thì giá trca hàm li sgim đi so vi trước khi cp nht.  
Giá trca nh hưởng ln đến tc độ hi tca thut tn. Nếu ln thì  
độ dch chuyn ln, kết xut ca mng có thdao động rt tht thường (vì có thể  
nhy qua đim cc tiu) và thut tn khó hi t. Nếu nh, ta phi cn rt nhiu  
bước lp để đi đến được vtrí cc tiu ca hàm li.  
c. Quy tc tính đạo hàm li:  
SVTH : NguynĐình Cường  
Trang 28  
Nhn dng kí tviết tay và phát trin ng dng  
Sai strung bình bình phương thường được sdng để đo lường strùng  
khp gia ánh x( ký hiu NN) cn xây dng vi hàm đích cho trước (qua tp  
mu).  
Cho tp mu:  
=(Xk, Zk) =(xk1, …,xkM;zk1,…,zkN ); xki, zkj R ; i= 1,…,M; j=1,…,N;  
k=1,…,K, gi Tk= NN(Xk)=(tk1,…,tkN) thì sai strung bình bình phương slà:  
N
K
1
(z t )2  
2   
kn  
kn  
n1 k1  
E   
Đạo hàm hàm li có thể được tính da vào quy tc chui như sau:  
N.K  
wn  
w  
w  
E E  
1   
w w1 w2  
Ta xét tng trường hp cth:  
Trng snút xut:  
Ta có chui tính đạo hàm hàm li theo trng sgia lp n và lp xut:  
E E z v  
b z v b  
Mt nút xut không nh hưởng gì đến sai sca các nút xut khác trong lp  
xut. Để đơn gin trong công thc ta bqua chsca các nút xut, nếu nút xut  
đang xét có giá trthc là z và giá trị đúng ca nút đó là t, thì sai sbình phương  
là:  
1
E (z t)2  
2
E  
z  
Từ đó ta có:  
z t  
Mt khác độ dc hàm logistic được tính như sau:  
z  
g(v)'   
z(1z)  
v  
Tính shng th3, v/b trong công thc E/b  
Ta có:  
J
v b b y  
0
j
j
j1  
Xét vi b0 ta có: v/b0 =1  
Vi trng sbj, ta có: v/bj =yj  
Đặt:  
E z  
p   
z v  
SVTH : NguynĐình Cường  
Trang 29  

Tải về để xem bản đầy đủ

pdf 64 trang yennguyen 30/12/2024 200
Bạn đang xem 30 trang mẫu của tài liệu "Đồ án Tìm hiểu bài toán nhận dạng kí tự viết tay và phát triển ứng dụng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfdo_an_tim_hieu_bai_toan_nhan_dang_ki_tu_viet_tay_va_phat_tri.pdf