Luận văn Khảo sát ứng dụng của tập thô trong lựa chọn và rút gọn đặc trưng cho bài toán nhận dạng

Luận văn  
Kho sát ng dng ca tp  
thô trong la chn và rút  
gọn đặc trưng cho bài toán  
nhn dng  
Mc Lc  
Danh Sách Các Hình......................................................................................................5  
Danh Sách Các Bng......................................................................................................7  
Li Mở Đầu.....................................................................................................................8  
Chương 1 .......................................................................................................................10  
Lý Thuyết Tp Thô......................................................................................................10  
1.1. Gii thiu............................................................................................................10  
1.2. Hthông tin........................................................................................................11  
1.3. Quan hbt khphân bit ...............................................................................13  
1.3.1. Sdư tha thông tin..................................................................................13  
1.3.2. Quan htương đương - Lp tương đương..............................................13  
1.3.3. Thut toán xác định lp tương đương.....................................................15  
1.4. Xp xtp hp...................................................................................................16  
1.5. Skhông chc chn và hàm thuc..................................................................25  
1.6. Sphthuc gia các tp thuc tính.............................................................27  
1.7. Rút gn thuc tính............................................................................................28  
1.7.1. Khái nim ...................................................................................................28  
1.7.2. Ma trn phân bit và hàm phân bit .......................................................30  
1.8. Mt sthut toán hiu qu..............................................................................36  
1.8.1. Lp tương đương.......................................................................................36  
1.8.2. Xp xtrên, xp xdưới.............................................................................37  
1.8.3. Vùng dương................................................................................................38  
1.8.4. Rút gn thuc tính .....................................................................................38  
1.8.4.1. Chiến lược Johnson.............................................................................39  
1.8.4.2. Chiến lược ngu nhiên........................................................................40  
1.8.4.3. Loi bthuc tính tha trong mt rút gn.......................................41  
================================ 1 ================================  
Chương 2 .......................................................................................................................42  
Bài Toán Nhn Dng Mt Người................................................................................42  
2.1. Gii thiu...........................................................................................................42  
2.2. Các nghiên cu trước đây................................................................................45  
2.3. Mô hình nhn dng mt người tiêu biu........................................................48  
2.3.1. Mô hình.......................................................................................................48  
2.3.2. Rút trích đặc trưng....................................................................................49  
2.3.3. Nhn dng mu..........................................................................................50  
2.4. Mt skhó khăn trong nhn dng mt người...............................................51  
2.5. Phương pháp nhn dng mt người bng mt riêng....................................54  
2.5.1. Mô tphương pháp ...................................................................................55  
2.5.2. Vn đề tìm các mt riêng ..........................................................................57  
2.5.3. Sdng mt riêng để nhn dng .............................................................60  
2.5.4. Tóm tt phương pháp nhn dng bng mt riêng .................................62  
2.6. ng dng các thut toán lượng hoá vector trong quá trình phân lp........63  
2.6.1. Gii thiu ....................................................................................................63  
2.6.2. Mt sthut toán lượng hoá vector.........................................................64  
2.6.2.1. Thut toán LVQ1................................................................................64  
2.6.2.2. Thut toán OLVQ1.............................................................................66  
2.6.3. Vn đề khi to vector tham chiếu ..........................................................67  
Chương 3 .......................................................................................................................70  
ng Dng Tp Thô Vào ..............................................................................................70  
Bài Toán Nhn Dng Mt Người................................................................................70  
3.1. Gii thiu...........................................................................................................70  
3.2.1. Phương pháp chung...................................................................................71  
3.2.2. Kết hp heuristic và lý thuyết tp thô .....................................................71  
3.2.2.1. Mô theuristic.....................................................................................71  
================================ 2 ================================  
3.2.2.2. Thut toán............................................................................................72  
3.2.2.3. Ví dminh ho....................................................................................73  
3.3. Mô hình thnghim.........................................................................................77  
3.3.1. Tp dliu..................................................................................................77  
3.3.2. Mô hình 1....................................................................................................78  
3.3.3. Mô hình 2....................................................................................................80  
3.3.4. Vn đề la chn skhong ri rc...........................................................84  
Chương 4 .......................................................................................................................86  
Cài Đặt Chương Trình.................................................................................................86  
Và ThNghim ............................................................................................................86  
4.1. Chương trình cài đặt........................................................................................86  
4.1.1. Ngôn ngvà môi trường ...........................................................................86  
4.1.2. Tchc thư mc mã ngun ......................................................................86  
4.1.3. Mt slp quan trng...............................................................................86  
1. Lp bng quyết định .................................................................................86  
2. Các lp thc hin rút trích đặc trưng......................................................87  
3. Lp ri rc hoá ..........................................................................................88  
4. Lp thut toán tp thô ..............................................................................88  
5. Các lp rút gn thuc tính........................................................................88  
6. Lp mng lượng hoá vector (LVQ) .........................................................90  
7. Lp thut toán phân loi người láng ging gn nht.............................90  
4.2. Tchc dliu thnghim.............................................................................90  
4.3. Hướng dn và minh hosdng chương trình ............................................91  
4.3.1. Màn hình chính..........................................................................................91  
4.3.2. Nhp tp nh hun luyn..........................................................................92  
4.3.3. Chn thut toán rút gn thuc tính .........................................................94  
4.3.4. Quá trình hun luyn ................................................................................94  
================================ 3 ================================  
4.3.5. Quá trình phân lp....................................................................................96  
4.3.6. Xem thông tin.............................................................................................97  
4.4. Mt skết qu...................................................................................................98  
4.4.1. Thư mc Face_10_24_20...........................................................................98  
4.4.2. Thư mc Face_15_24_20...........................................................................99  
4.4.3. Thư mc Face_20_24_20.........................................................................100  
4.4.4. Thư mc Face_25_24_20.........................................................................101  
4.5. Nhn xét kết qu.............................................................................................102  
Chương 5 .....................................................................................................................104  
Tự Đánh Giá Và Hướng Phát ...................................................................................104  
Trin Đề Ngh.............................................................................................................104  
5.1. Tự đánh giá .....................................................................................................104  
5.2. Hướng phát trin đề ngh...............................................................................105  
Tài Liu Tham Kho..................................................................................................106  
================================ 4 ================================  
Danh Sách Các Hình  
Hình 1- 1 : Xp xtp đối tượng trong Bng 1- 2 bng các thuc tính điu kin Age và  
LEMS. Mi vùng được thhin kèm theo tp các lp tương đương tương ng. ..19  
Hình 1- 2 : Ma trn phân bit ca Bng1-7....................................................................31  
Hình 1- 3 : Ma trn phân bit ca hthông tin Bng 1-7 xây........................................32  
Hình 1- 4 : Ma trn phân bit gia các lp tương đương ca........................................33  
Hình 1- 5 : Ma trn phân bit tương đối ........................................................................33  
Hình 1- 6 : Ma trn phân bit Hình 1-2 sau khi chn c .................................................34  
Hình 2- 1 : Mô hình nhn dng mt người tiêu biu.....................................................49  
Hình 2- 2 : nh vi nn phc tp vi ...........................................................................51  
Hình 2- 3 : Kết quca mt bdò tìm thng................................................................53  
Hình 2- 4 : Vùng “đáng knht” ca gương mt .........................................................53  
Hình 2- 5 : Kết qudò tìm trên nh có gương mt được hoá trang ..............................54  
Hình 2- 6 : Tp nh hun luyn và nh trung bình .......................................................58  
Hình 2- 7 : Các mt riêng tương ng vi by giá trriêng ln nht .............................60  
Hình 2- 8 : Vector tham chiếu được di chuyn gn vi vector dliu hơn – trường  
hp hai vector này cùng lp......................................................................66  
Hình 2- 9 : Vector tham chiếu được đẩy ra xa vector dliu hơn - trường hp hai  
vector này khác lp ...................................................................................66  
Hình 2- 10 : Vector tham chiếu OC khi to không tt nên sau khi cp nht thành  
OC1 thì càng xa vector dliu OA hơn. ...............................................68  
Hình 3- 1 : Ma trn phân bit tương đối ca hthông tin trong Bng 3-1 ...................75  
Hình 3- 2 : Phân chia tp dliu hun luyn và kim tra.............................................78  
Hình 3- 3 : nh ca 10 người đầu tiên trong tp dliu ORL.....................................78  
================================ 5 ================================  
Hình 3- 4 : Giai đon hun luyn to tp vector tham chiếu ........................................79  
Hình 3- 5 : Giai đon phân lp tp nh kim tra...........................................................80  
Hình 3- 6 : Giai đon hun luyn to tp vector tham chiếu ........................................84  
Hình 3- 7 : Giai đon phân lp tp nh kim tra...........................................................84  
================================ 6 ================================  
Danh Sách Các Bng  
Bng 1- 1 : Mt hthông tin đơn gin...........................................................................11  
Bng 1- 2 : Mt hquyết định vi C = {Age, LEMS} D = {Walk}.............................12  
Bng 1- 3 : Mt bng dliu dư tha thông tin.............................................................13  
Bng 1- 4 : Mt hquyết định điu tra vn đề da cháy nng.........................................16  
Bng 1- 5 : Hthông tin vcác thuc tính ca xe hơi...................................................20  
Bng 1- 6 : Bng quyết định dùng minh hohàm thuc thô .........................................26  
Bng 1- 7 : Hthông tin dùng minh homa trn phân bit.........................................31  
Bng 1- 8 : Mt hthông tin..........................................................................................35  
Bng 3- 1 : Bng quyết định cho ví dminh ho..........................................................74  
Bng 3- 2 : Trng thái ban đầu.......................................................................................75  
Bng 3- 3 : Trng thái tiếp theo khi thêm a ..................................................................76  
Bng 3- 4 : Trng thái tiếp theo khi thêm c ..................................................................76  
Bng 3- 5 : Trng thái tiếp theo khi thêm d ..................................................................76  
Bng 4- 1 : Kết quhun luyn, kim tra tp Face_10_24_20......................................99  
Bng 4- 2 : Kết quhun luyn, kim tra tp Face_15_24_20....................................100  
Bng 4- 3 : Kết quhun luyn, kim tra tp Face_20_24_20....................................101  
Bng 4- 4 : K ết quhun luyn, kim tra tp Face_25_24_20...................................102  
================================ 7 ================================  
Li Mở Đầu  
-----oOo-----  
Trong chuyên ngành Trí tunhân to, Nhn dng là mt trong nhng lĩnh vc phát  
trin sm nht và đã tìm được rt nhiu ng dng trong cuc sng, chng hn như dự  
báo tim năng khoáng sn từ ảnh vtinh, nhn din ti phm qua vân tay, hay gn đây  
người ta đưa ra khái nim ngôi nhà thông minh vi nhiu chc năng tự động hoá hoàn  
toàn da vào khnăng nhn biết các đặc đim ca chnhân (như tiếng nói, dáng  
người,…). Chính vì tm quan trng như vy, lĩnh vc Nhn dng đã thu hút được sự  
quan tâm nghiên cu ca nhiu nhà khoa hc. Rt nhiu thut toán và mô hình đã được  
đưa ra nhm tăng ti đa hiu sut ca các giai đon trong mt hthng nhn dng.  
Trong số đó, vn đề la chn và rút gn đặc trưng liên quan trc tiếp đến độ chính xác  
và tc độ ca hthng. Đây cũng là lý do ca vic chn đề tài :  
“Kho Sát ng Dng Ca Tp Thô Trong La Chn Và  
Rút Gn Đặc Trưng Cho Bài Toán  
Nhn Dng Mt Người”  
Vic la chn lý thuyết Tp thô trong vn đề nêu trên xut phát tnhng ng dng  
rt thành công ca nó trong thc tế như các hdbáo hay chun đoán da trên lut.  
Ngoài ra, ý tưởng gn lin đối tượng vi thông tin cũng như các khái nim rút gn  
thuc tính được đưa ra trong lý thuyết này ha hn khnăng thành công cho hthng  
nhn dng kết hp vi lý thuyết Tp thô.  
Cui cùng, đối tượng nhn dng được thnghim trong lun văn này là khuôn mt  
bi đây là đối tượng nghiên cu khá lý thú vi nhiu đặc đim phong phú mang hàm  
lượng thông tin cao như cm xúc, tui tác,…và các hthng nhn dng mt người  
đang đóng vai trò quan trng trong bo mt và an ninh.  
Vi cách đặt vn đề như trên, lun văn được cu trúc thành 5 chương như sau :  
================================ 8 ================================  
™ Chương 1 : Lý thuyết Tp thô.  
™ Chương 2 : Bài toán nhn dng mt người.  
™ Chương 3 : ng dng Tp thô vào bài toán nhn dng mt người.  
™ Chương 4 : Cài đặt chương trình và thnghim.  
™ Chương 5 : Tự đánh giá và hướng phát trin đề ngh.  
================================ 9 ================================  
Chương 1 – Lý thuyết Tp thô  
Chương 1  
Lý Thuyết Tp Thô  
-----oOo-----  
1.1. Gii thiu  
Lý thuyết tp thô (rough set theory) ln đầu tiên được đề xut bi Z. Pawlak và  
nhanh chóng được xem như mt công cxlý các thông tin mơ hvà không chc  
chn. Phương pháp này đóng vai trò hết sc quan trng trong lĩnh vc trí tunhn to  
và các ngành khoa hc khác liên quan đến nhn thc, đặc bit là lĩnh vc máy hc, thu  
nhn tri thc, phân tích quyết định, phát hin và khám phá tri thc tcơ sdliu, các  
hchuyên gia, các hhtrquyết định, lp lun da trên quy np và nhn dng [5].  
Lý thuyết tp thô da trên githiết rng để định nghĩa mt tp hp, chúng ta cn  
phi có thông tin vmi đối tượng trong tp vũ tr. Ví d, nếu các đối tượng là nhng  
bnh nhân bmt bnh nht định thì các triu chng ca bnh to thành thông tin về  
bnh nhân. Như vy tp thô có quan đim hoàn toàn khác vi quan đim truyn thng  
ca tp hp, trong đó mi tp hp đều được định nghĩa duy nht bi các phn tca nó  
mà không cn biết bt kthông tin nào vcác phn tca tp hp. Rõ ràng, có thtn  
ti mt số đối tượng ging nhau mt sthông tin nào đó, và ta nói chúng có quan hệ  
bt khphân bit vi nhau. Đây chính là quan hmu cht và là đim xut phát ca lý  
thuyết tp thô : biên gii ca tp thô là không rõ ràng, và để xác định nó chúng ta phi  
đi xp xnó bng các tp hp khác nhm mc đích cui cùng là trli được (tt nhiên  
càng chính xác càng tt) rng mt đối tượng nào đó có thuc tp hp hay không. Lý  
thuyết tp thô vi cách tiếp cn như vy đã được ng dng trong rt nhiu lĩnh vc ca  
đời sng xã hi.  
================================ 10 ================================  
Chương 1 – Lý thuyết Tp thô  
Trong chương này chúng ta snghiên cu các khái nim và ý nghĩa cơ bn ca lý  
thuyết tp thô. Đây là nhng kiến thc quan trng cho vic áp dng tp thô vào bài  
toán la chn và rút gn đặc trưng cho bài toán nhn dng được đề cp trong chương 3.  
1.2. Hthông tin  
Mt tp dliu thhin dưới dng bng, trong đó mi dòng thhin cho mt  
trường hp, mt skin, mt bnh nhân hay đơn gin là mt đối tượng. Mi ct ca  
bng thhin mt thuc tính (là mt giá tr, mt quan sát, mt đặc đim, …) được “đo  
lường” cho tng đối tượng. Ngoài ra giá trca thuc tính cũng có thể được cung cp  
bi chuyên gia hay bi người sdng. Mt bng như vy được gi là mt hthông tin  
(information system) .  
Mt cách hình thc, hthông tin là mt cp A = (U, A) trong đó U là tp hu hn  
không rng các đối tượng và được gi là tp vũ tr, A là tp hu hn không rng các  
thuc tính sao cho a :U Va vi mi a A. Tp Va được gi là tp giá trca thuc  
tính a .  
Ví d1-1 : Bng dliu trong Bng 1-1dưới đây cho ta hình nh vmt hthông  
tin vi 7 đối tượng và 2 thuc tính [1].  
Age  
LEMS  
50  
x1  
x2  
x3  
x4  
x5  
x6  
x7  
16 – 30  
16 – 30  
31 – 45  
31 – 45  
46 – 60  
16 – 30  
46 – 60  
0
1 – 25  
1 – 25  
26 – 49  
26 – 49  
26 – 49  
Bng 1- 1 : Mt hthông tin đơn gin  
================================ 11 ================================  
Chương 1 – Lý thuyết Tp thô  
Ta có thddàng nhn thy rng trong bng trên, các cp đối tượng x3 , x4 x5 ,  
x7 có giá trbng nhau ti chai thuc tính. Khi đó ta nói rng các đối tượng này  
không phân bit tng đôi đối vi tp thuc tính {Age, LEMS} .  
Trong nhiu ng dng, tp vũ trụ được phân chia thành các tp đối tượng con bi  
mt tp các thuc tính phân bit được gi là tp thuc tính quyết định. Nói cách khác  
tp vũ trụ đã được phân lp bi thuc tính quyết định. Hthông tin trong trường hp  
này được gi là mt hquyết định. Như vy hquyết định là mt hthông tin có dng  
A = (U,C D) trong đó A = C D , C D ln lượt được gi là tp thuc tính điu  
kin và tp thuc tính quyết định ca hthông tin.  
Ví d1-2 : Bng 1-2 dưới đây thhin mt hquyết định, trong đó tp thuc tính  
điu kin ging như trong Bng 1-1 và mt thuc tính quyết định {Walk} được thêm  
vào nhn hai giá trkết xut là Yes No [1].  
Age  
Walk  
Yes  
No  
LEMS  
50  
x1  
x2  
x3  
x4  
x5  
x6  
x7  
16 – 30  
16 – 30  
31 – 45  
31 – 45  
46 – 60  
16 – 30  
46 – 60  
0
No  
1 – 25  
1 – 25  
26 – 49  
26 – 49  
26 – 49  
Yes  
No  
Yes  
No  
Bng 1- 2 : Mt hquyết định vi C = {Age, LEMS} D = {Walk}  
Mt ln na ta thy rng, các cp đối tượng x3 , x4 x5 , x7 vn có giá trnhư  
nhau ti hai thuc tính điu kin, nhưng cp thnht {x3 , x4} thì có giá trkết xut khác  
nhau (tc giá trti thuc tính quyết định khác nhau), trong khi đó cp thhai {x5 , x7 }  
thì bng nhau ti thuc tính quyết định.  
================================ 12 ================================  
Chương 1 – Lý thuyết Tp thô  
1.3. Quan hbt khphân bit  
1.3.1. Sdư tha thông tin  
Mt hquyết định (hay mt bng quyết định) thhin tri thc vcác đối tượng  
trong thế gii thc. Tuy nhiên trong nhiu trường hp bng này có thể được tinh gim  
do tn ti ít nht hai khnăng dư tha thông tin sau đây :  
Nhiu đối tượng ging nhau, hay không thphân bit vi nhau li được  
thhin lp li nhiu ln.  
Mt sthuc tính có thlà dư tha, theo nghĩa khi bỏ đi các thuc tính  
này thì thông tin do bng quyết định cung cp mà chúng ta quan tâm sẽ  
không bmt mát.  
Ví d1-3 : Trong bng Bng 1-3 dưới đây, nếu chúng ta chquan tâm ti tp  
thuc tính {a,b,c} ca các đối tượng thì ta scó nhn xét : có thbỏ đi thuc tính c mà  
thông tin vcác đối tượng vn không đổi, chng hn nếu ta có mt đối tượng vi hai  
thuc tính a , b nhn hai giá tr0 , 1 thì có thnói ngay rng giá trca nó ti thuc  
tính c 1.  
Bng 1- 3 : Mt bng dliu dư tha thông tin  
1.3.2. Quan htương đương - Lp tương đương  
================================ 13 ================================  
Chương 1 – Lý thuyết Tp thô  
Chúng ta bt đầu xem xét vn đề dư tha thông tin nói trên qua khái nim quan hệ  
tương đương. Mt quan hhai ngôi R XxX được gi là quan htương đương khi và  
chkhi :  
R là quan hphn x: xRx,x X .  
R là quan hệ đối xng : xRy yRx,x, y X .  
R là quan hbc cu : xRy yRz xRz , x, y, z X .  
Mt quan htương đương R sphân hoch tp đối tượng thành các lp tương  
đương, trong đó lp tương đương ca mt đối tượng x là tp tt ccác đối tượng có  
quan hR vi x .  
Tiếp theo, xét hthông tin A = (U, A) . Khi đó mi tp thuc tính B A đều to ra  
tương ng mt quan htương đương IND A :  
IND A (B) = {(x, x') U 2 | a B,a(x) = a(x')}  
IND A (B) được gi là quan hB -bt khphân bit. Nếu (x, x')IND A (B) thì các  
đối tượng x x' là không thphân bit được vi nhau qua tp thuc tính B . Vi mi  
đối tượng x U , lp tương đương ca x trong quan hIND A (B) được kí hiu bi  
[x]B . Nếu không bnhm ln ta viết IND(B) thay cho IND A (B) . Cui cùng, quan hệ  
B -bt khphân bit phân hoch tp đối tượng U thành các lp tương đương mà ta kí  
hiu là U | IND(B) .  
Ví d1-4 : Tp thuc tính {a,b,c} trong Bng 1-3 phân tp đối tượng {1,2,...,9}  
thành tp lp tương đương sau :  
U | IND(B) = {{1},{2,3,4},{5,6,7},{8,9}}  
Ta thy, chng hn, do đối tượng 2 đối tượng 3 thuc cùng mt lp tương  
đương nên chúng không phân bit được vi nhau qua tp thuc tính{a,b,c}.  
Ví d1-5 : Trong ví dnày chúng ta sxem xét các quan hbt khphân bit được  
định nghĩa trong Bng 1-2.  
================================ 14 ================================  
Chương 1 – Lý thuyết Tp thô  
Chng hn, xét ti thuc tính {LEMS}, các đối tượng x3 , x4 có cùng giá tr125  
nên thuc cùng lp tương đương định bi quan hIND({LEMS}) , hay chúng bt khả  
phân bit qua tp thuc tính {LEMS}. Tương tnhư vy là ba đối tượng x5 , x6 x7  
cùng thuc vào mt lp tương đương định bi quan hIND({LEMS}) tương ng vi  
giá trthuc tính LEMS bng 26 49 .  
Quan hIND định ra ba phân hoch sau ca tp các đối tượng trong vũ tr:  
IND({Age}) = {{x1, x2 , x6},{x3 , x4},{x5 , x7 }}  
IND({LEMS}) = {{x1},{x2},{x3 , x4},{x5 , x6 , x7 }}  
IND({Age, LEMS}) = {{x1},{x2},{x3 , x4},{x5 , x7 },{x6}}  
1.3.3. Thut toán xác định lp tương đương  
Vào :  
ƒ Tp đối tượng O  
ƒ Tp thuc tính B  
Ra :  
ƒ Tp các lp tương đương L  
Thut toán :  
Bước 1: L = ∅  
Bước 2: Nếu O = ∅  
Thì : Thc hin bước 5.  
Ngược li : Thc hin bước 3.  
Hết nếu  
Bước 3: Xét x O  
P = {x}  
O = O \ {x}  
Vi mi phn ty O :  
Nếu x y không thphân bit được qua tp thuc tính B  
================================ 15 ================================  
Chương 1 – Lý thuyết Tp thô  
Thì : P = P {y}  
O = O \ {y}  
Hết nếu  
Hết vi mi  
L = L {P}  
Bước 4: Thc hin bước 2.  
Bước 5: Kết thúc.  
1.4. Xp xtp hp  
Như trên đã nói, mt quan htương đương cho ta mt sphân hoch các đối tượng  
ca tp vũ tr. Các lp tương đương này có thể được sdng để to nên các tp con  
ca tp vũ tr. Các tp con này thường cha các đối tượng có cùng giá trti tp các  
thuc tính quyết định. Trong trường hp này ta nói rng các khái nim, hay tp các giá  
trti tp các thuc tính quyết định, có thể được mô tmt cách rõ ràng thông qua tp  
các giá trti tp các thuc tính điu kin. Để làm rõ ý tưởng quan trng này ta xem ví  
ddưới đây.  
Ví d1-6 : Xét hquyết định điu tra vn đề da cháy nng sau đây  
Trng  
lượng  
Nhẹ  
Dùng  
thuc  
Có  
STT  
Kết quả  
1
2
3
4
Không cháy nng  
Không cháy nng  
Cháy nng  
Nhẹ  
Có  
Nng  
Không  
Không  
Trung bình  
Không cháy nng  
Bng 1- 4 : Mt hquyết định điu tra vn đề da cháy nng  
Trong hquyết định trên, thuc tính Kết qulà thuc tính quyết định và hai thuc  
tính gia là thuc tính điu kin. Tp thuc tính điu kin C = {Trng lượng, Dùng  
thuc} phân hoch tp các đối tượng thành các lp tương đương :  
================================ 16 ================================  
Chương 1 – Lý thuyết Tp thô  
U | IND(C) = {{1,2},{3},{4}}  
Nhn xét rng tt ccác đối tượng thuc cùng mt lp tương đương đều có cùng  
giá trti thuc tính quyết định. Do đó ta có thmô tthuc tính quyết định như sau :  
ƒ Kết quskhông cháy nng nếu và chnếu  
trng lượng là nhdùng thuc hoc  
trng lượng trung bình không dùng thuc.  
ƒ Kết quscháy nng nếu và chnếu  
trng lượng là nng không dùng thuc.  
Ta nói hai khái nim Cháy nng Không cháy nng trong thuc tính Kết qucó  
thể được định nghĩa rõ ràng qua 2 thuc tính Trng lượng Dùng thuc. Tuy vy  
không phi lúc nào cũng có thể định nghĩa mt khái nim nào đó mt cách rõ ràng như  
vy. Chng hn vi bng quyết định trong Bng 1-2, khái nim Walk không thể định  
nghĩa rõ ràng qua 2 thuc tính điu kin Age LEMS : hai đối tượng x3 x4 thuc  
cùng mt lp tương đương to bi 2 thuc tính điu kin nhưng li có giá trkhác  
nhau ti thuc tính Walk, vì vy nếu mt đối tượng nào đó có  
(Age, LEMS) = (3145,125) thì ta vn không thbiết chc chn giá trca nó ti thuc  
tính Walk (Yes hay No ?), nói cách khác ta skhông thcó mt lut như sau : “Walk là  
Yes nếu Age 3145 LEMS 125 ”. đây chính là nơi mà khái nim tp thô  
được sdng! .  
Mc dù không thmô tkhái nim Walk mt cách rõ ràng nhưng căn cvào tp  
thuc tính {Age, LEMS} ta vn có thchra được chc chn mt số đối tượng có Walk  
Yes , mt số đối tượng có Walk No , còn li là các đối tượng thuc vbiên gii  
ca 2 giá trYes No , cth:  
Nếu đối tượng nào có giá trti tp thuc tính {Age, LEMS} thuc tp  
{{16 – 30, 50}, {16 – 30, 26 – 49}} thì nó có Walk Yes .  
================================ 17 ================================  
Chương 1 – Lý thuyết Tp thô  
Nếu đối tượng nào có giá trti tp thuc tính {Age, LEMS} thuc tp  
{{16 – 30, 0}, {46 – 60, 26 – 49}} thì nó có Walk No .  
Nếu đối tượng nào có giá trti tp thuc tính {Age, LEMS} thuc tp  
{{31 – 45, 1 – 25}} thì nó có Walk Yes hoc No . Nhng đối tượng  
này, như nói trên thuc vbiên gii ca 2 giá trYes No .  
Nhng khái nim trên được thhin mt cách hình thc như sau.  
Cho hthông tin A = (U, A) , tp thuc tính B A, tp đối tượng X U . Chúng ta  
có thxp xtp hp X bng cách chsdng các thuc tính trong B tvic xây  
dng các tp hp B -xp xdưới B -xp xtrên được định nghĩa như sau :  
B -xp xdưới ca tp X : BX = {x |[x]B X}  
B -xp xtrên ca tp X : BX = {x |[x]B X ≠ ∅}  
Tp hp BX là tp các đối tượng trong U mà sdng các thuc tính trong B ta có  
thbiết chc chn được chúng là các phn tca X .  
Tp hp BX là tp các đối tượng trong U mà sdng các thuc tính trong B ta chỉ  
có thnói rng chúng có thlà các phn tca X .  
Tp hp BNB (X ) = BX \ BX được gi là B -biên ca tp X và cha nhng đối  
tượng mà sdng các thuc tính ca B ta không thxác định được chúng có thuc tp  
X hay không.  
Tp hp U \ BX được gi là B -ngoài ca tp X , gm nhng đối tượng mà sdng  
tp thuc tính B ta biết chc chn chúng không thuc tp X .  
Mt tp hp được gi là thô nếu đường biên ca nó là không rng, ngược li ta nói  
tp này là . Lưu ý rng do khái nim biên ca mt tp đối tượng gn lin vi mt tp  
thuc tính nào đó nên khái nim thô hay rõ ở đây cũng gn lin vi tp thuc tính đó.  
Trong đa strường hp, người ta luôn mun hình thành các định nghĩa ca các lp  
quyết định tcác thuc tính điu kin.  
Ví d1-7 :  
================================ 18 ================================  
Chương 1 – Lý thuyết Tp thô  
Xét Bng 1-2 trên vi tp đối tượng W = {x |Walk(x) = Yes} = {x1, x4 , x6} và tp  
thuc tính B = {Age, LEMS}. Khi đó ta nhn được các vùng xp xsau đây ca W  
thông qua B :  
BW = {x1, x6} , BW = {x1, x3 , x4 , x6}  
BNB (W) = {x3 , x4} , U \ BW = {x2 , x5 , x7 }  
Hình 1- 1 : Xp xtp đối tượng trong Bng 1- 2 bng các thuc tính điu kin Age và  
LEMS. Mi vùng được thhin kèm theo tp các lp tương đương tương ng.  
Ví d1-8 : Ta xét mt ví dkhác vi bng giá trvthuc tính ca xe hơi như sau :  
Đối  
Model Cylinder  
Door  
Power  
Weight  
Mileage  
tượng  
1
2
3
4
5
6
7
8
USA  
USA  
USA  
USA  
USA  
USA  
USA  
USA  
6
6
4
4
4
6
4
4
2
4
2
2
2
4
2
2
High  
Medium  
Medium  
Medium  
High  
Medium  
Medium  
Medium  
Medium  
Medium  
Medium  
Medium  
Medium  
Medium  
Medium  
High  
Medium Medium  
High  
Medium  
Light  
Medium  
High  
High  
================================ 19 ================================  
Chương 1 – Lý thuyết Tp thô  
9
Japan  
Japan  
Japan  
Japan  
Japan  
USA  
4
4
4
4
4
4
2
2
2
2
2
2
Low  
Medium  
High  
Light  
High  
High  
High  
High  
High  
High  
10  
11  
12  
13  
14  
Medium  
Medium  
Medium  
Medium  
Medium  
Low  
Medium  
Medium  
Bng 1- 5 : Hthông tin vcác thuc tính ca xe hơi  
Ta có tp vũ trU = {1,2,...,14}. Gischn tp thuc tính  
B ={Cylinder, Power,Weight} và chn thuc tính quyết định là D = Mileage. Như vy  
thuc tính quyết định gm 2 khái nim DMedium ="Mileage = Medium" và  
DHigh ="Mileage = High" .  
DMedium = {1,2,3,4,5,6,7}  
DHigh = {8,9,10,11,12,13,14}  
Các lp tương đương ng vi quan hIND(B) là : E1 = {1,6}, E2 = {2},  
E3 = {3,4,10,13,14}, E4 = {5,7,11}, E5 = {8}, E6 = {9} E7 = {12}.  
Xp xtrên và xp xdưới ca DMedium DHigh là :  
BDMedium = {E1, E2} = {1,6,2}  
BDMedium = {E1, E2 , E3 , E4} = {1,6,2,3,4,10,13,14,5,7,11}  
BDHigh = {E5 , E6 , E7 } = {8,9,12}  
BDHigh = {E3 , E4 , E5 , E6 , E7 } = {3,4,10,13,14,5,7,11,8,9,12}  
Mt stính cht ca các tp hp xp xỉ  
1. B(X ) X B(X )  
2. B() = B() = , B(U) = B(U) = U  
================================ 20 ================================  
Chương 1 – Lý thuyết Tp thô  
3. B(X Y) = B(X ) B(Y)  
4. B(X Y) = B(X ) B(Y)  
5. Nếu X Y thì B(X ) B(Y), B(X ) B(Y)  
6. B(X Y) B(X ) B(Y)  
7. B(X Y) B(X ) B(Y)  
8. B(U \ X ) = U \ B(X )  
9. B(U \ X ) = U \ B(X )  
10. B(B(X )) = B(B(X )) = B(X )  
11. B(B(X )) = B(B(X )) = B(X )  
Ta chng minh mt số định lý đin hình.  
3. Từ định nghĩa xp xtrên ta có:  
o B(X Y) ⇔ ∃ P U | IND(B): (o P, P (X Y) ≠ ∅)  
Mt khác : P (X Y) ≠ ∅ P X ≠ ∅ hoc P Y .  
Do đó :  
o B(X Y) (o P, P X ≠ ∅) hoc (o P, P Y ≠ ∅)  
(o B(X )) hoc (o B(Y))  
o B(X ) B(Y)  
(đpcm)  
4. Chng minh tương t3.  
5. Chng minh : (X Y) (B(X ) B(Y))  
Gis: X Y  
Xét o B(X ) . Khi đó : P, P U | IND(B) : o P, P X .  
X Y  
nên P Y . Nhưng theo định nghĩa tp xp xdưới :  
B(Y) = {x | x P, P U | IND(B), P Y}  
Nên : P B(Y), từ đó : o B(Y)  
================================ 21 ================================  
Chương 1 – Lý thuyết Tp thô  
Vy : B(X ) B(Y) . Tương tta chng minh được B(X ) B(Y)  
6. Xét o B(X ) B(Y) P, P U | IND(B),o P,(P X P Y)  
P X Y . Mt khác theo định nghĩa tp xp xdưới :  
B(X Y) = {x | x P, P U | IND(B), P X Y}  
Vy : P B(X Y) , từ đó o B(X Y)  
đpcm.  
7. Chng minh tương t6  
8. Ta có : B(U \ X ) = { P | P U | IND(B), P U \ X}  
U
= U \{ P | P U | IND(B),P X ≠ ∅}  
U
= U \ B(X ) (đpcm).  
9. Chng minh tương thoc có thsuy ra t8.  
10. Từ định nghĩa ca tp xp xdưới :  
B(B(X )) = {x U |[x]B B(X )}  
= {x U |[x]B X} , vì B(X ) X  
= B(X )  
Tương t: B(B(X )) = B(X ). Vy ta có đpcm.  
11. Chng minh tương t10.  
Da vào ý nghĩa ca các xp xtrên và xp xdưới, người ta định nghĩa bn lp cơ  
bn ca các tp thô, hay bn hình thc ca smơ h(vagueness) :  
(a) X được gi là B -định nghĩa được mt cách thô (roughly B -definable) nếu  
và chnếu B(X ) ≠ ∅ B(X ) U .  
(b) X được gi là B -không định nghĩa được mt cách ni vi (internally B -  
undefinable) nếu và chnếu B(X ) = ∅ B(X ) U .  
(c) X được gi là B -không định nghĩa được mt cách ngoi vi (externally B -  
undefinable) nếu và chnếu B(X ) ≠ ∅ B(X ) = U .  
================================ 22 ================================  
Chương 1 – Lý thuyết Tp thô  
(d) X được gi là B -không định nghĩa được mt cách hoàn toàn (totally B -  
undefinable) nếu và chnếu B(X ) = ∅ B(X ) = U .  
Các khái nim trên có thdin tnhư sau :  
X B -định nghĩa được mt cách thô nghĩa là : vi sgiúp đỡ ca tp  
thuc tính B ta có thchra mt số đối tượng ca U thuc vtp X và  
mt số đối tượng ca U thuc vU \ X .  
X B -không định nghĩa được mt cách ni vi nghĩa là : sdng tp  
thuc tính B ta có thchra mt số đối tượng ca U thuc vU \ X ,  
nhưng li không thchra được các đối tượng thuc vX .  
X B -không định nghĩa được mt cách ngoi vi nghĩa là : sdng tp  
thuc tính B ta có thchra mt số đối tượng ca U thuc vX , nhưng  
không chra được các đối tượng thuc vU \ X .  
X B -không định nghĩa được mt cách hoàn toàn nghĩa là : sdng  
tp thuc tính B ta không thchra bt kỳ đối tượng nào ca U thuc về  
X hay thuc vU \ X .  
Cui cùng, mt tp thô có thể được định lượng bi hs:  
| B(X ) |  
αB (X ) =  
| B(X ) |  
được gi là độ chính xác ca xp x, trong đó | X | chsphn tca tp X . Rõ  
ràng 0 < αB (X ) < 1. Nếu αB (X ) = 1 thì X rõ ( chính xác) đối vi tp thuc tính B .  
Ngược li, nếu αB (X ) < 1 thì X thô (mơ h) đối vi tp thuc tính B .  
Chúng ta kết thúc mc này vi thut toán xác định các xp xtrên và xp xdưới  
ca mt tp đối tượng theo mt tp thuc tính cho trước.  
Thut toán xác định xp xdưới  
Vào :  
ƒ Tp các đối tượng X  
================================ 23 ================================  
Chương 1 – Lý thuyết Tp thô  
ƒ Tp các thuc tính B  
Ra :  
ƒ Tp các đối tượng BX  
Thut toán :  
Bước 1 : Khi to BX = ∅ .  
Xác định tp các phân hoch P ca tp vũ trU to bi B.  
Bước 2 : U1 = U  
Nếu U1 ≠ ∅  
Thì : Thc hin bước 3.  
Ngược li : Thc hin bước 5  
Hết nếu  
Bước 3 : Xét x U1  
Tìm phân hoch Pi P sao cho : x Pi .  
Nếu Pi X  
Thì : BX = BX P  
i
Hết nếu  
U1 = U1 \ Pi .  
Bước 4 : Thc hin bước 2.  
Bước 5 : Kết thúc  
Thut toán xác định xp xtrên  
Vào :  
ƒ Tp các đối tượng X  
ƒ Tp các thuc tính B  
Ra :  
ƒ Tp các đối tượng BX  
Thut toán :  
================================ 24 ================================  
Chương 1 – Lý thuyết Tp thô  
Bước 1 : Khi to BX = ∅ .  
Xác định tp các phân hoch P ca tp vũ trU to bi B.  
Bước 2 : X1 = X  
Nếu X1 ≠ ∅  
Thì : Thc hin bước 3.  
Ngược li : Thc hin bước 5  
Hết nếu  
Bước 3 : Xét x X1 .  
Tìm phân hoch Pi P sao cho : x Pi .  
BX = BX P  
i
Vi mi p Pi X1  
X1 = X1 \ {p}  
Hết vi mi  
Bước 4 : Thc hin bước 2.  
Bước 5 : Kết thúc.  
1.5. Skhông chc chn và hàm thuc  
Chúng ta đã biết BNB (X ) là tp các đối tượng trong tp vũ trU mà bng cách sử  
dng tp thuc tính B ta không thxác định được chc chn chúng có thuc tp đối  
tượng X hay không. Do đó, skhông chc chn trong ngcnh này gn vi mt câu  
hi vđộ thuc (membership) ca các phn tvào mt tp hp.  
Trong lý thuyết tp hp cổ đin, mt phn thoc là thuc vào tp hp hoc không.  
Như vy hàm thuc tương ng là mt hàm đặc trưng cho tp hp, nghĩa là hàm snhn  
giá tr0 1 tương ng.  
Trong lý thuyết tp thô, hàm thuc thô µXB là khái nim dùng để đo mc độ thuc  
ca đối tượng x trong tp vũ trU vào tp các đối tượng X U , và được tính bi  
================================ 25 ================================  
Chương 1 – Lý thuyết Tp thô  
mc độ giao nhau gia tp X và lp tương đương [x]B đối tượng x thuc v. Mt  
cách hình thc, ta có :  
µXB : U [0,1]  
[x]B X  
x
a
[x]B  
Mt stính cht ca hàm thuc thô  
1. µXB (x) = 1 x BX  
2. µXB (x) = 0 x U BX  
3. 0 < µXB (x) < 1 x BNB (X )  
4. µXB (x) = µXB (y) nếu (x, y) IND(B)  
5. µUBX (x) = 1µXB (x),x U  
6. µXBY (x) = max(µXB (x),µYB (x)),x U  
7. µXBY (x) = min(µXB (x),µYB (x)),x U  
Ví d1-9 : Xét bng quyết định dưới đây  
A0  
1
2
4
1
3
1
A
A2  
A3  
34  
23  
32  
12  
32  
12  
A4  
1
x0  
x1  
x2  
x3  
x4  
x5  
A
A
B
B
B
B
2
3
3
2
1
4
Black  
Blue  
White  
Black  
Blue  
Black  
Bng 1- 6 : Bng quyết định dùng minh hohàm thuc thô  
================================ 26 ================================  
Chương 1 – Lý thuyết Tp thô  
Xét tp thuc tính B = {A0 , A } và tp đối tượng X = {x0 , x1, x3}. Lp tương đương  
1
tương ng vi quan hIND(B) là : E1 = {x0}, E2 = {x1}, E3 = {x2}, E4 = {x3 , x5},  
E5 = {x4}.  
Áp dng định nghĩa hàm thuc thô, ta thu được :  
{x0}  
µXB (x0 ) =  
= 1.0  
{x0}  
{x3}  
{x3 , x5}  
µXB (x0 ) =  
= 0.5  
Từ định nghĩa hàm thuc thô, hai khái nim xp xtrên và xp xdưới có thể được  
1
xây dng mt cách tng quát tương ng vi mt độ bt kπ ( ,1] như sau :  
2
Bπ (X ) = {x | µ B (x) π}  
X
Bπ (X ) = {x | µ B (x) > 1π}  
X
Lưu ý rng hai khái nim xp xtrên và xp xdưới mà ta đã xây dng trong phn  
1.4 tương ng vi trường hp độ π = 1.0 .  
1.6. Sphthuc gia các tp thuc tính  
Mt vn đề quan trng trong phân tích dliu là khám phá sphthuc gia các  
thuc tính. Mt cách trc giác, mt tp thuc tính D được cho là phthuc hoàn toàn  
vào tp thuc tính C , ký hiu C D , nếu tt ccác giá trca các thuc tính trong D  
có thể được xác định duy nht bi các giá trca các thuc tính trong C . Nói cách  
khác, D phthuc hoàn toàn vào C nếu tn ti mt ánh xtcác giá trca tp C ti  
các giá trca tp D . Khái nim phthuc thuc tính được thhin dưới dng hình  
thc như sau.  
Cho C D là các tp con ca tp thuc tính A . Ta nói D phthuc C vi độ  
phthuc k (0 k 1) , kí hiu C k D nếu :  
================================ 27 ================================  
Chương 1 – Lý thuyết Tp thô  
| POSC (D) |  
|U |  
k = γ (C, D) =  
trong đó  
POSC (D) =  
C(X )  
U
XU|IND(D)  
được gi là C -vùng dương ca D . Đây là tp các đối tượng ca U mà bng cách sử  
dng tp thuc tính C ta có thphân chúng mt cách duy nht vào các phân hoch ca  
U theo tp thuc tính D .  
Ddàng thy rng :  
CX  
γ (C, D) =  
U
XU|IND(D)  
Nếu k = 1 thì ta nói D phthuc hoàn toàn vào C , ngược li nếu k < 1 thì ta nói D  
phthuc mt phn vào C vi độ phthuc k .  
Có thnhn thy rng nếu D phthuc hoàn toàn vào C thì IND(C) IND(D) .  
Điu này có nghĩa là các phân hoch to ra bi tp thuc tính C mn hơn các phân  
hoch to ra bi D .  
1.7. Rút gn thuc tính  
1.7.1. Khái nim  
Trong phn 1.3 chúng đã đề cp đến hai khnăng dư tha trong mt hthông tin,  
đó là :  
ƒ Các đối tượng ging nhau theo mt tp thuc tính đang quan tâm được lp  
li nhiu ln.  
ƒ Mt sthuc tính có thể được bỏ đi mà thông tin chúng ta đang quan tâm do  
bng quyết định cung cp vn không bmt mát.  
Vi trường hp thnht, khái nim lp tương đương hin nhiên cho ta mt tiếp cn  
tnhiên trong vic tinh gim thông tin cn lưu trtrong mt hthông tin : chcn sử  
dng mt đối tượng để đại din cho mi lp tương đương. Trong phn này chúng ta  
================================ 28 ================================  
Chương 1 – Lý thuyết Tp thô  
nghiên cu tiếp cn cho loi dư tha thông tin thhai, đó là chgili nhng thuc  
tính bo toàn quan hbt khphân bit, và do đó bo toàn khnăng xp xtp hp  
trong mt hthông tin.  
Xét hthông tin A = (U, A) và hai tp thuc tính P,Q A. Thuc tính a P được  
gi là có thbỏ được (dispensible) trong P nếu IND(P) = IND(P {a}) , ngược li ta  
nói a không thbỏ được (indispensible) trong P . Rõ ràng thuc tính có thbỏ được  
không làm tăng / gim khnăng phân loi khi có / không có mt thuc tính đó trong  
P . Tp tt ccác thuc tính không thbỏ được trong P được gi là lõi (core) ca P ,  
ký hiu CORE(P) . Lưu ý rng lõi có thlà tp rng, và khi đó mi tp con ca P vi  
lc lượng bng card(P) 1 đều ginguyên khnăng phân loi ca P .  
Khi loi ra khi P mt sthuc tính có thbỏ được thì ta được mt tp rút gn ca  
P . Nói cách khác, rút gn ca mt tp thuc tính P là tp thuc tính B P giữ  
nguyên khnăng phân loi ca P , hay IND(B) = IND(P) . Ddàng thy rng, vì lõi ca  
P là tp các thuc tính không thbỏ được ca P nên tt ccác rút gn ca P đều  
cha tp thuc tính lõi.  
Mt rút gn B ca tp thuc tính P được gi là rút gn hoàn toàn nếu vi mi tp  
thuc tính B' B , B' không là rút gn ca P . Như vy rút gn hoàn toàn là tp thuc  
tính nhnht trong tt ccác rút gn có thcó ca P được ký hiu là RED(P) .  
Tính cht : Tp thuc tính lõi ca P là giao ca tt ccác rút gn hoàn toàn ca P ,  
tc là :  
CORE(P) = RED(P)  
I
Để minh hocho nhng khái nim trên, ta xét ví dsau.  
Ví d1-10 : Xét Bng 1-3 vi tp thuc tính P = {a,b,c}. Ta có :  
U | IND(P) = {{1},{2,3,4},{5,6},{7,8,9}}  
U | IND({a}) = {{1,2,3,4},{5,6,7,8,9}}  
U | IND({b}) = {{1,5,6},{2,3,4,7,8,9}}  
U | IND({c}) = {{1,2,3,4},{5,6,7,8,9}}  
================================ 29 ================================  

Tải về để xem bản đầy đủ

pdf 109 trang yennguyen 21/05/2025 60
Bạn đang xem 30 trang mẫu của tài liệu "Luận văn Khảo sát ứng dụng của tập thô trong lựa chọn và rút gọn đặc trưng cho bài toán nhận dạng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfluan_van_khao_sat_ung_dung_cua_tap_tho_trong_lua_chon_va_rut.pdf