Luận văn Gán nhãn phân tích cú pháp quan hệ cho song ngữ Anh Việt thông qua liên kết ngữ

TRƯỜNG ĐẠI HC KHOA HC TNHIÊN  
KHOA CÔNG NGHTHÔNG TIN  
BMÔN CÔNG NGHTRI THC  
NGUYN THNG NHT – LÊ MINH SƠN  
GÁN NHÃN PHÂN TÍCH CÚ PHÁP QUAN H  
CHO SONG NGANH VIT  
THÔNG QUA LIÊN KT NGỮ  
LUN VĂN CNHÂN TIN HC  
TP. HChí Minh – Năm 2003  
TRƯỜNG ĐẠI HC KHOA HC TNHIÊN  
KHOA CÔNG NGHTHÔNG TIN  
BMÔN CÔNG NGHTRI THC  
NGUYN THNG NHT – 9912053  
LÊ MINH SƠN - 9912668  
GÁN NHÃN PHÂN TÍCH CÚ PHÁP QUAN HỆ  
CHO SONG NGANH VIT  
THÔNG QUA LIÊN KT NGỮ  
LUN VĂN CNHÂN TIN HC  
GIÁO VIÊN HƯỚNG DN  
GS.TSKH. HOÀNG KIM  
NIÊN KHOÁ 1999 - 2003  
Li cm ơn  
Trước hết, chúng tôi xin chân thành gi li cm ơn đến GS.TSKH. Hoàng Kiếm,  
người đã tn ty dn dt chúng tôi tng bước để hoàn thành bài lun văn này. Chúng  
tôi cũng chân thành cm ơn các Thy Cô trong và ngoài khoa Công nghthông tin đã  
truyn đạt kiến thc quý báu cho tôi trong sut bn năm hc.  
Để hoàn thành bài lun văn này, chúng tôi không thkhông nhc đến sự động viên  
và chăm sóc ca gia đình. Ngoài ra, chúng tôi gi li cám ơn đến nhng người mà  
chúng tôi đã có dp cng tác và sự ủng htinh thn ca bn bè.  
Cui cùng chúng tôi cũng mun gi li cám ơn đến Thy Đinh Đin và các thành  
viên trong nhóm VCL, nhng người đã giúp đỡ cho chúng tôi hoàn tt bài lun văn  
này.  
Chúng tôi xin chân thành cm ơn tt c.  
TP. HChí Minh, 7-2003  
Nguyn Thng Nht và Lê Minh Sơn  
Nhn xét ca giáo viên hướng dn  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
TP. HChí Minh, ngày ........ tháng .......năm 2003  
Giáo viên hướng dn  
GS. TSKH. Hoàng Kiếm  
Nhn xét ca giáo viên phn bin  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
.....................................................................................................................  
TP. HChí Minh, ngày ........ tháng .......năm 2003  
Giáo viên phn bin  
MC LC  
LI NÓI ĐẦU................................................................................................................. 1  
Chương 1: TNG QUAN ........................................................................................... 1  
1.1. Phân tích cú pháp quan h................................................................................ 1  
1.2. Liên kết t/ng.................................................................................................. 1  
1.3. Chiếu quan hcú pháp ..................................................................................... 3  
1.3.1. Chiếu nhãn tloi..................................................................................... 3  
1.3.2. Chiếu quan hcú pháp..............................................................................4  
Chương 2: CÁC CÁCH TIP CN........................................................................... 5  
2.1. Phân tích cú pháp.............................................................................................. 5  
2.1.1. Các phương pháp tiếp cn dùng lut phi ngcnh (CFG)..................... 5  
2.1.1.1. Cách tiếp cn ttrên xung (Top-Down)......................................... 5  
2.1.1.2. Thut toán phân tích cú pháp ttrên xung (Top-Down)............... 7  
2.1.1.3. Cách tiếp cn Tdưới lên (Bottom-Up)........................................... 8  
2.1.1.4. Thut toán phân tích cú pháp Earley...............................................11  
2.1.1.5. Mng ngpháp lan truyn...............................................................12  
2.1.2. Phương pháp TBL (Transformation-Based Error-Driven Learning) ..15  
2.1.3. Phương pháp phân tích cú pháp da trên văn phm TAG ...................19  
2.1.3.1. Văn phm TAGs...............................................................................19  
2.1.3.1.1. Cây sơ cp..................................................................................19  
2.1.3.1.2. Cây phtr................................................................................19  
2.1.3.2. Các tác ttrong TAGs......................................................................20  
2.1.3.2.1. Tác tthêm vào.........................................................................20  
2.1.3.2.2. Tác tthay thế:..........................................................................21  
2.1.3.3. Nhng điu kin kết hp trên cây ...................................................21  
2.1.3.4. Cây rng............................................................................................21  
2.1.4. Phương pháp phân tích cú pháp da trên nguyên tc...........................22  
X
2.1.4.1.1. Thuyết X-Bar ( ) ....................................................................23  
2.1.4.1.2. Nguyên lý Theta........................................................................23  
2.1.4.1.3. Thuyết lc vai (Case-filter) ......................................................23  
2.1.4.1.4. Thuyết kết hp...........................................................................23  
2.1.4.1.5. Thuyết vtính cc bvà trường rng......................................23  
2.1.4.1.6. Thuyết dch chuyn...................................................................24  
2.2. Các cách tiếp cn trong vic liên kết t/ng.................................................24  
2.2.1. Char-Align – Hthng Termight...........................................................26  
2.2.2. Phương pháp K-vec ................................................................................28  
2.2.3. Phương pháp DK-vec .............................................................................29  
2.2.4. Ánh xsong ngvi SIMR....................................................................30  
2.2.5. Mô hình xác sut vi thut toán IPFP....................................................30  
2.2.6. Mô hình da vào sphân lp (Class-based).........................................33  
2.2.7. Mô hình liên kết da vào cách tiếp cn dch máy thng kê (SMT).....33  
2.3. Các phương pháp chiếu..................................................................................34  
2.3.1. Chiếu nhãn tloi...................................................................................34  
2.3.1.1. Phương pháp trc tiếp......................................................................34  
2.3.1.2. Phương pháp Noise-robust...............................................................34  
2.3.1.3. Phương pháp sdng lut tương tác...............................................35  
2.3.2. Chiếu quan h..........................................................................................35  
2.3.2.1. Mô hình xác sut ..............................................................................35  
2.3.2.2. Phương pháp DCA (Direct Correspondence Assumption)............35  
2.3.2.3. Các phương pháp khác.....................................................................36  
Chương 3: MÔ HÌNH THUT TOÁN....................................................................37  
3.1. Phân tích cú pháp da trên nguyên tc..........................................................37  
3.1.1. Khái quát .................................................................................................37  
3.1.2. Ý tưởng cơ bn ca phương pháp phân tích da trên nguyên tc........39  
3.1.3. Mt sít nhng nguyên tc thay thế cho rt nhiu lut .......................41  
3.1.3.1. Nhng thành phn cơ bn................................................................41  
3.1.3.2. Tham s.............................................................................................41  
3.1.4. Câu hi đặt ra ..........................................................................................42  
3.1.5. Các nguyên tc........................................................................................43  
X
3.1.5.1. Thuyết Xbar ( theory)...................................................................43  
3.1.5.2. Tiêu chun Theta (Theta Criterion).................................................44  
3.1.5.3. Blc vai (Case-Filter)....................................................................45  
3.1.5.4. Thuyết kết hp(Binding Theory).....................................................47  
3.1.5.5. Thuyết vtính cc bvà trường rng.............................................47  
3.1.5.6. Thuyết dch chuyn..........................................................................48  
3.1.6. Trt tkết hp các nguyên tc...............................................................48  
3.1.6.1. Dự đoán li trước .............................................................................49  
3.1.6.2. Mô hình động....................................................................................49  
3.1.7. Các bước phân tích cú pháp ...................................................................50  
3.1.7.1. Phân tích tvng..............................................................................50  
3.1.7.2. Phân tích và tìm ra các cây cú pháp thích hp ...............................50  
3.1.7.3. Chn cây cú pháp thích hp nht ....................................................55  
3.1.7.4. Trng s............................................................................................55  
3.1.7.5. Chn cây ...........................................................................................55  
3.2. Mô hình liên kết t/ngtrong song ngAnh-Vit.......................................56  
3.2.1. Gii thiu mô hình dch máy thng kê..................................................56  
3.2.2. Định nghĩa liên kết t/ng......................................................................59  
3.2.3. Mô hình ngôn ng...................................................................................62  
3.2.4. Mô hình dch ...........................................................................................64  
3.2.4.1. Mô hình 1..........................................................................................67  
3.2.4.2. Mô hình 2..........................................................................................69  
3.2.4.3. Mt cách đặt vn đề khác.................................................................71  
3.2.4.4. Mô hình 3..........................................................................................73  
3.2.4.5. Mô hình 4..........................................................................................75  
3.2.4.6. Mô hình 5..........................................................................................76  
3.2.5. Thut toán Ước lượng-Cc đại (Estimation-Maximization Algorithm –  
viết tt là thut toán EM)...........................................................................................78  
3.2.6. Ci tiến thut toán EM trong mô hình 3, 4 và 5....................................80  
3.2.7. Tìm liên kết tti ưu nht......................................................................84  
3.2.8. Ci tiến mô hình liên kết từ để liên kết ng..........................................85  
3.3. Chiếu kết quphân tích cú pháp sang Tiếng Vit........................................89  
3.3.1. Chiếu nhãn tloi...................................................................................89  
3.3.2. Chiếu quan h..........................................................................................90  
3.3.3. Sdng lut tương tác............................................................................90  
Chương 4: CÀI ĐẶT THC NGHIM...................................................................91  
4.1. Chương trình phân tích cú pháp quan h......................................................91  
4.1.1. Phân tích tvng....................................................................................91  
4.1.1.1. Từ đin ..............................................................................................91  
4.1.1.1.1. Cu trúc .....................................................................................91  
4.1.1.1.2. Sphân loi động t.................................................................94  
4.1.1.1.3. Mc ttham chiếu ....................................................................96  
4.1.2. Phân tích cú pháp quan h......................................................................97  
4.1.2.1. Từ đin chngca động t...........................................................97  
4.1.2.2. Mng cú pháp ...................................................................................98  
4.1.2.3. Sơ đồ lp...........................................................................................99  
4.1.2.4. Kết quả đầu ra.................................................................................100  
4.1.3. Các thuc tính .......................................................................................101  
4.2. Chương trình liên kết t/ng........................................................................102  
4.2.1. Phân tích................................................................................................102  
4.2.1.1. Phân tích tng quát.........................................................................103  
4.2.1.2. Phân tích chi tiết.............................................................................104  
4.2.1.2.1. Lưu đồ ca mô hình hun luyn dch thng kê P(v | e) .......104  
4.2.1.2.2. Lưu đồ ca mô hình liên kết ng...........................................105  
4.2.2. Thiết kế..................................................................................................107  
4.2.2.1. Sơ đồ lp.........................................................................................107  
4.2.2.2. Danh sách các thuc tính ca tng lp .........................................108  
4.2.2.3. Danh sách các phương thc ca tng lp.....................................109  
4.2.2.4. Sơ đồ hot động tng thca các lp cho quá trình hun luyn.111  
4.2.3. Cài đặt các hàm xlý chính.................................................................112  
4.2.3.1. Hàm khi gán thông st trong lp Model1..................................112  
4.2.3.2. Hàm khi gán thông sa trong lp Model2.................................112  
4.2.3.3. Vòng lp EM trong lp Model1 ....................................................113  
4.2.3.4. Vòng lp EM trong lp Model2 ....................................................113  
4.2.3.5. Vòng lp EM trong lp Model3 ....................................................114  
4.2.3.6. Tìm liên kết ti ưu nht trong mô hình 1......................................115  
4.2.3.7. Tìm liên kết ti ưu nht trong mô hình 2......................................116  
4.2.3.8. Tìm liên kết ti ưu nht trong mô hình 3......................................117  
4.3. Chiếu kết quphân tích cú pháp sang Tiếng Vit......................................117  
4.3.1. Chiếu nhãn tloi.................................................................................117  
4.3.2. Chiếu quan h........................................................................................118  
4.3.3. Sdng lut tương tác..........................................................................119  
Chương 5: KT QU- ĐÁNH GIÁ – KT LUN – HƯỚNG PHÁT TRIN 120  
5.1. Chương trình liên kết t...............................................................................120  
5.1.1. Mt skết qu.......................................................................................120  
5.1.2. Giao din ca chương trình thnghim liên kết.................................124  
5.1.3. Đánh giá.................................................................................................125  
5.2. Chương trình phân tích quan hcú pháp ....................................................128  
5.2.1. Kết qu...................................................................................................128  
5.2.2. Đánh giá.................................................................................................130  
5.2.2.1. Ngliu mu ..................................................................................130  
5.2.2.2. Kết quả đánh giá.............................................................................131  
5.3. Chương trình chiếu kết quphân tích cú pháp ...........................................132  
5.3.1. Chiếu kết qutloi.............................................................................132  
5.3.2. Chiếu kết quphân tích quan h........................................................134  
5.4. Kết lun.........................................................................................................134  
5.5. Hướng phát trin...........................................................................................135  
PHLC A: Bng qui ước các ký hiu ca mô hình dch máy thng kê..............136  
PHLC B: Các thuc tính trong phân tích cú pháp quan h................................139  
PHLC C: Bnhãn tloi tiếng Anh...................................................................145  
PHLC D: Các mi quan htrong tiếng Anh.......................................................147  
TÀI LIU THAM KHO ..........................................................................................149  
LI NÓI ĐẦU  
Vi sphát trin như vũ bão ca khoa hc kthut như hin nay, tin hc trthành  
mt nhu cu không ththiếu được trong hu hết các lĩnh vc ca đời sng xã hi. Tuy  
nhiên, vic giao tiếp gia người và máy không phi lúc nào cũng tnhiên, thun li.  
Nguyên nhân chính có llà do có skhác bit ln gia hai thế gii người và máy.  
Ngành hc xlý ngôn ngtnhiên ra đời cũng nhm mc đích xoá đi ngăn cách khác  
bit ngôn nggia người và máy tính.  
Tuy nhiên, ngành xlý ngôn ngtnhiên là mt lĩnh vc không d. Nó chphát  
trin mnh trong my thp niên gn đây. Đặc bit là đối vi các ngôn ngphbiến trên  
thế gii như tiếng Anh, tiếng Hoa, tiếng Pháp… Quá trình nghiên cu này đã để li cho  
nhân loi nhiu thành tu to ln. Nhu cu vkế tha nhng thành quca tiếng Anh  
để áp dng cho các ngôn ngkhác (như là tiếng Vit) là mt nhu cu thiết thc. Để  
tha hưởng được nhng thành qunày, chúng tôi nghiên cu các kết quca phân tích  
cú pháp tiếng Anh và chiếu sang tiếng Vit thông qua liên kết t/ng. Kết quca vic  
phân tích cú pháp tiếng Anh và chiếu sang tiếng Vit được làm ngliu cho vic hc,  
giám sát và rút ra các lut chuyn đổi cú pháp gia hai ngôn ngAnh-Vit để phc vụ  
cho chương trình dch tự động Anh Vit.  
Các bước cơ bn cho vic chiếu kết quphân tích cú pháp bao gm ba bước chính:  
đầu tiên là phân tích cú pháp cho ngôn ngngun (ở đây là tiếng Anh), sau đó liên kết  
t/ng, cui cùng sdng kết quliên kết t/ngữ để chiếu sang ngôn ngữ đích (ở đây  
là tiếng Vit). Trong bài lun văn này chúng tôi strình bày chi tiết các phương pháp  
cho tng bước xlý này.  
Ni dung ca bài lun văn được sp xếp thành 5 chương như sau:  
Chương 1: trình bày khái quát các bước gii quyết vn đề.  
Chương 2: chúng tôi trình bày sơ lược các cách tiếp cn cho các bước xlý và  
chn ra cách tiếp cn ti ưu để nghiên cu.  
Chương 3: gii thiu mô hình thut toán chi tiết cho tng bước xlý chính  
theo các cách tiếp cn mà chúng tôi đã chn và được trình bày trong chương 2.  
Chương 4: cài đặt cthcho các bước xlý.  
Chương 5: nêu ra mt skết quvà cách đánh giá các kết quả đó, và cui  
cùng là kết lun và đưa ra hướng phát trin.  
Chương 1: TNG QUAN  
Chương 1: TNG QUAN  
Các bước cơ bn cho vic chiếu kết quphân tích cú pháp bao gm ba bước chính:  
đầu tiên là phân tích cú pháp cho ngôn ngngun (ở đây là tiếng Anh), sau đó liên kết  
t/ng, cui cùng sdng kết quliên kết t/ngữ để chiếu sang ngôn ngữ đích (ở đây  
là tiếng Vit). Trong chương này chúng tôi sgii thiu sơ lược các bước chính này để  
độc gicó thnm được khái quát các bước xlý chính này.  
1.1. Phân tích cú pháp quan h  
Mun có sgiao tiếp bng ngôn ngtnhiên gia người và máy, đầu tiên máy tính  
phi hiu được ngôn ngtnhiên. Bước đầu tiên để hiu được mt câu, máy phi biết  
được cu trúc ca câu cũng như quan hgia các thành phn trong câu. Xác định cu  
trúc, quan hnày được gi là phân tích cú pháp.  
Tuy nhiên, mun phân tích cú pháp thì đầu tiên phi đánh nhãn được tloi ca  
tng ttrong câu, từ đó mi có thtng quát hoá cho máy hiu được nhng cu trúc và  
nhng quan hệ ở mc tng quát có thể được.  
1.2. Liên kết t/ngữ  
Vn đề dch gia các ngôn nglà vn đề cxưa và rng rãi. Nhiu nhà nghiên cu  
trên thế gii đã và đang làm vic ct lc để tìm ra các phương pháp cho dch máy tự  
động. Do đó có nhiu cách tiếp cn khác nhau trong vic dch tự động. Mc dù vy,  
vn đề dch máy vn còn là mt vn đề tranh cãi gia các cách tiếp cn. Có mt vài sự  
bt đồng ý kiến vcác phương pháp để thc hin. Mt nhóm các nhà nghiên cu theo  
cách tiếp cn cơ stri thc (knowledge-based) thì cho rng để được cht lượng dch  
1
Chương 1: TNG QUAN  
cao thì đòi hi kiến thc ngôn nghc đáng kvà phi có cơ skiến thc ln. Mt  
nhóm khác theo cách tiếp cn thng kê (statistic) thì cho rng trong thc tế không thể  
xây dng mt cơ stri thc đủ ln để làm ngliu khthi, nhưng nếu da vào mt  
ngliu song ng(tiếng Anh là bilingual corpus, parallel text, hay bitext) ln để to ra  
mt mô hình thng kê thì có thto mt hthng dch máy hiu quhơn. Còn mt  
nhóm khác na thì cho rng chai phương pháp đều có mt mnh và mt yếu riêng ca  
nó, và họ đã đề ra mt phương pháp mi bng cách kết hp chai cách tiếp cn cơ sở  
tri thc và tiếp cn thng kê, và cách tiếp cn đó được gi là cách tiếp cn lai (hybrid  
approach).  
Đối vi cách tiếp cn cơ stri thc thì công vic xây dng từ đin, xây dng các  
lut chuyn đổi hu hết đều được xây dng bng tay bi các chuyên gia ngôn ng. Như  
vy, đối vi cách tiếp cn này thì đòi hi công vic và thi gian rt ln. Ngoài ra,  
chúng ta sẽ đặt câu hi rng: “Cơ sdliu cho từ đin và các lut chuyn đổi bao  
nhiêu là đủ?”. Và đây là đim yếu ca cách tiếp cn cơ stri thc. Đối vi cách tiếp  
cn thng kê thì các công vic xây dng từ đin và xây dng các lut chuyn đổi hoàn  
toàn tự động bng máy tính. Máy tính sthng kê và rút ra các thông sthng kê  
tương ng vt/nghay cu trúc gia hai ngôn ngcũng như xác sut dch gia hai  
ngôn ng, và xác sut xut hin ca t/ngữ đó trong mt ngcnh nht định nào đó.  
Khuyết đim ca cách tiếp cn này là hoàn toàn da vào ngsong ngữ đã được dch  
sn bi con người, vì thế nếu dliu được dch tt và ngliu càng ln thì độ chính  
xác trong vic thng kê càng cao.  
Trong nhng năm gn đây, dch máy đã đạt được nhng thành công nhvào công  
nghmáy hc, và vic hc này được da vào ngliu song ng. Để hdch máy Anh-  
Vit có thtiếp cn theo hướng này thì bước đầu tiên trong vic xlý ngliu song  
ngchính là vic liên kết t/ngca ngôn ngngun (ở đây là tiếng Anh) vi các  
t/ngca ngôn ngữ đích (ở đây là tiếng Vit). Vic liên kết t/ngkhông thể đơn  
thun tra từ đin song ngAnh-Vit, vì sphong phú trong cách dch và tính đa nghĩa  
2
Chương 1: TNG QUAN  
ca các ttrong chai ngôn ng. Ngoài ra còn có skhó khăn rt ln khác là do sự  
khác bit vmt tvng hoá (lexicalization) ca hai ngôn ngkhác bit vloi hình:  
gia tiếng Anh (mt thtiếng biến hình) vi tiếng Vit (mt thtiếng đơn lp). Trong  
khuôn khbài lun văn này, chúng tôi strình bày các mô hình dch máy thng kê để  
liên kết tvà cm ttrong văn bn song ngAnh-Vit. Các mô hình mà chúng tôi đề  
cp đến được thc hin hoàn toàn tự động bng máy. Ngliu song ngmà chúng tôi  
sdng khong mt triu câu song ngAnh-Vit được nhp tcách sách song ngvề  
khoa hc kthut và đã được đánh liên kết bng tay. Ngliu này sẽ được đưa vào hệ  
thng để hun luyn, tính xác sut, và thnghim. Kết quđược sau khi qua hệ  
thng là các câu song ngtrong ngliu sẽ được liên kết.  
Kết quca vic liên kết t/ngmà chúng tôi thu được trong cách tiếp cn thng kê  
hết sc quan trng đối vi hdch máy và góp phn không nhcho các hướng tiếp cn  
khác như: kho sát sthay đổi trt ttca cây cú pháp tiếng Vit và cây cú pháp  
tiếng Anh, gii quyết vn đề nhp nhng ngnghĩa, gán nhãn phân tích cú pháp cho  
song ngAnh-Vit, … Trong bài lun văn này chúng tôi strình bày cthể ứng dng  
kết quliên kết t/ngcho vic gán nhãn phân tích cú pháp cho song ngAnh-Vit.  
1.3. Chiếu quan hcú pháp  
Chiếu quan hcú pháp là sdng kết quliên kết t/ngữ để ánh xkết quca các  
mi quan hcú pháp đã được đánh nhãn trong tiếng Anh sang tiếng Vit. Quá trình  
chiếu này chia làm 2 giai đon: chiếu nhãn tloi và chiếu quan hcú pháp.  
1.3.1. Chiếu nhãn tloi  
Tkết quả đánh nhãn tloi trên câu tiếng Anh, thông qua mi liên kết t/ngữ để  
đánh nhãn tloi cho các t/ngtrong câu tiếng Vit. Các vn đề cn gii quyết là:  
3
Chương 1: TNG QUAN  
Trong tiếng Anh, các từ được cách nhau bng khong trng trong khi đó từ  
trong tiếng Vit có thgm nhiu âm tiết ( mi âm tiết cách nhau bng khong  
trng). Do đó, trước khi đánh nhãn tloi cho tiếng Vit phi tách t.  
Tiếp theo, thông qua mi liên kết t/ng, nhãn tloi ca tiếng Anh sẽ được  
chiếu sang tiếng Vit. Tuy nhiên, đây không phi là phép ánh x1-1 bi vì: hệ  
thng tloi trong 2 ngôn nglà khác nhau. Ngoài ra, hai ngôn ngcó skhác  
bit ln vphong cách trình bày. Do đó, không phi lúc nào cũng tìm ra được  
stương ng vtloi gia hai ngôn ng.  
1.3.2. Chiếu quan hcú pháp  
Cũng ging như chiếu nhãn tloi, kết ququan hcú pháp để chiếu sang tiếng  
Vit thông qua mi liên kết t/ng. Tuy nhiên, nhng nhp nhng do skhác bit gia  
hai ngôn ngsẽ được gii quyết bng các nhãn tloi đã được đánh bước trước.  
Hai bước này có mi quan hcht ch, có thnhvào tloi để làm rõ cho quan hệ  
cú pháp, ngược li nhvào quan hcú pháp có thlàm rõ được nhng tbnhp  
nhng tloi.  
4
Chương 2: CÁC CÁCH TIP CN  
Chương 2: CÁC CÁCH TIP CN  
Vn đề chiếu kết quphân tích cú pháp tmt ngôn ngnày sang ngôn ngkhác là  
mt nhu cu cn thiết cho các nước mà vic xlý ngôn ngtnhiên chưa được phát  
trin mnh (như các nước đang phát trin trong đó có Vit Nam chúng ta). Do đó, trên  
thế gii đã có nhiu nhà khoa hc nghiên cu nhiu cách tiếp cn khác nhau cho vn  
đề này. Các bước cơ bn để tiến hành công vic chiếu kết quphân tích cú pháp bao  
gm: đầu tiên là phân tích cú pháp cho ngôn ngngun, sau đó liên kết t/ng, cui  
cùng sdng kết quliên kết t/ngữ để chiếu sang ngôn ngữ đích. Phn đầu chúng tôi  
sgii thiu các cách tiếp cn ca các cách phân tích cú pháp cho ngôn ngngun  
(tiếng Anh), phn hai chúng tôi sgii thiu các cách tiếp cn ca liên kết t/ng(từ  
tiếng Anh sang tiếng Vit), cui cùng chúng tôi trình bày các phương pháp chiếu sang  
ngôn ngữ đích (tiếng Vit).  
2.1. Phân tích cú pháp  
2.1.1. Các phương pháp tiếp cn dùng lut phi ngcnh (CFG)  
2.1.1.1. Cách tiếp cn ttrên xung (Top-Down)  
Phân tích cú pháp theo cách tiếp cn ttrên xung bt đầu vi kí hiu S (sentence).  
Đây chính là cu trúc cao nht ca mt câu và hình thành nên trng thái ban đầu ca  
cu trúc câu. Kế tiếp, mi kí hiu trong chui trng thái hin ti sẽ được viết li thành  
nhng cu trúc thp hơn da vào các lut có sn to thành mt danh sách các kí hiu.  
Ví d: Câu bt đầu vi kí hiu S, sau đó nó áp dng lut S à NP VP. Danh sách kí  
hiu lúc này là (NP VP). Sau đó, kí hiu NP được xét đến và thomãn lut NPà ART  
N. Danh sách lut lúc này slà (ART N VP)…  
5
Chương 2: CÁC CÁCH TIP CN  
Quá trình clp li mt cách đệ quy cho đến khi nào trng thái ca câu bao gm  
toàn nhng kí hiu kết thúc. Tuy nhiên, đến lúc này, câu nhp vào cũng phi được đưa  
vào kim tra để bo đảm rng toàn bcâu đã được phân tích. Vì vy, dù gp phi mt  
danh sách bao gm toàn nhng kí hiu kết thúc nhưng câu vn còn tchưa được phân  
tích thì cu trúc tìm được là mt cu trúc sai.  
Tuy nhiên, bi vì tvng ca mt ngôn nglà rt ln cho nên có mt loi lut dng  
kí hiu kết thúcà tvng slà rt ln. Để tránh gp phi trường hp này, người ta đã  
tách riêng nó thành mt từ đin gi là từ đin tloi.  
Book : N , V  
Like : V , RB  
Do từ đin tloi đã được tách ra nên trong danh sách lut skhông còn lut nào  
cha lut tvng.  
Mt ví dụ đơn gin vi blut bao gm 5 lut như sau:  
Lut 1  
Lut 2  
Lut 3  
Lut 4  
Lut 5  
S à NP VP  
NP à ART N  
NP à ART ADJ N  
VP à V  
VP à V NP  
Bng 2.1. Ví dmt slut  
Trng thái ca câu bây giờ được định nghĩa thành mt cp : mt danh sách kí hiu  
và mt con schra vtrí hin ti trong câu. Vtrí này được đánh vào gia 2 tvi 1  
là vtrí trước từ đầu tiên ( ts1).  
Ví d:  
1 I 2 eat 3 rice4  
Và mt trng thái ca câu:  
((N VP)2)  
6
Chương 2: CÁC CÁCH TIP CN  
Trng thái này chra rng : chương trình phân tích mun tìm ra mt N (danh t) và  
được theo sau bi mt (ngữ động t), bt đầu tvtrí 2. Da vào vic kí hiu đầu tiên  
trong danh sách kí hiu có là kí hiu tvng hay không mà trng thái mi sẽ được hình  
thành da trên trng thái cũ.  
Như vy trng thái kế tiếp slà:  
((VP)3)  
Trng trái này nói lên ý nghĩa là : cn phi tìm mt V bt đầu ti vtrí s3 trong câu  
nhp. Nếu kí hiu đầu tiên là kí hiu không kết thúc, ging như VP, thì viết li kí hiu  
này bng lut cú pháp phù hp.  
Trong ví dtrên, nếu áp dng lut (4) thì trng thái kế tiếp slà :  
((V)3)  
trong khi đó, nếu áp dng lut (3) thì trng thái kế tiếp slà :  
((V NP)3)  
Thut toán phân tích bo đảm rng tt ccác gii pháp đều được xét ti. Chính vì  
đều này mà khi có nhiu hơn mt trng thái mi có thể được hình thành thì phi xử  
dng tt ccác trng thái cho chép này. Mt kĩ thut đơn gin được gi là quay lui theo  
vết(backtracking). Theo cách tiếp cn này, thay vì chsdng mt trng thái có ththì  
tt ccác trng thái đều được xét ti. Lưu các trng thái mi này thành nhng trng  
thái dphòng (backup state) ri sau đó xét qua hết tt ccác trng thái này. Nếu có  
mt trng thái nào đó dn đến không thể đi tiếp được na thì loi nó ra khi danh sách.  
2.1.1.2. Thut toán phân tích cú pháp ttrên xung (Top-Down)  
Thut toán phát sinh ra mt danh sách các trng thái có thgi là posssibilities list.  
Phn tử đầu tiên trong danh sách được chn làm trng thái hin ti.  
Thut toán bt đầu vi trng thái khi to là ((S) 1) và không có trng thái dự  
phóng.  
7
Chương 2: CÁC CÁCH TIP CN  
Bước 1 : Chn trng thái hin ti : phn tử đầu tiên trong possibilities list – gi là  
C - được chn làm trng thái hin hành . Nếu danh sách này rng thì thut  
toán tht bi – không có mt cu trúc nào phù hp vi câu nhp vào.  
Bước 2 : Nếu C rng và từ đang xét nm cui câu thì thut toán thành công.  
Bước 3 : Ngược li, phát sinh ra trng thái mi có th:  
Bước 4 : Nếu kí hiu đầu tiên trong danh sách C là mt kí hiu tvng (tloi) và  
ttrong câu ti vtrí đang xét phù hp vi kí hiu tvng này thì xoá đi  
kí hiu đầu tiên trong possibilities list và cp nht vtrí tvng trong câu  
tăng lên 1.  
Bước 5 : Ngược li, nếu kí hiu đầu tiên trong danh sách kí hiu ca C là mt kí  
hiu không kết thúc (non-terminal) thì phát sinh mt trng thái mi cho  
mi lut mà có thviết li kí hiu không kết thúc đó  
2.1.1.3. Cách tiếp cn Tdưới lên (Bottom-Up)  
Ging như tên được gi, quá trình hình thành cây cú pháp ca phương pháp này đi  
tmc thp lên mc cao hay tlá lên gc. Đim khác bit gia cách tiếp cn tdưới  
lên và ttrên xung được trình bày trên là các mà lut ngpháp được sdng. Ví dụ  
khi xét đến lut :  
NP à ART ADJ N  
Trong hthng ttrên xung, bn sdng lut để tìm NP bng các tìm kiếm chui  
ART ADJ N. Ngược li, trong hthng tdưới lên, tkết quhình thành bước trước  
đó, bn đã có mt chui ART ADJ N và bn gán cho chui này nhãn là NP.  
Thao tác cơ bn trong hthng tdưới lên là tìm các chui tun tphù hp vi vế  
phi và thay thế nó bng vế trái ca lut. Bn có thsdng xây dng mt bphân  
tích cú pháp tdưới lên đơn gin bng vic xây dng hai tiến trình : tiến trình so khp  
và tiến trình tìm kiếm. Cũng ging như cách tiếp cn tdưới lên, trng thái ban đầu sẽ  
được khi to và trng thái cui cùng dn được hình thành. Tuy nhiên, trng thái khi  
8
Chương 2: CÁC CÁCH TIP CN  
to ở đây là danh sách các ttrong câu và trng thái thành công (nếu có) là kí hiu S.  
Trng thái thành công có thể được hình thành tvic tìm và tt ccác cách có thể để :  
ü Viết li mt tbng tloi có thcó ca từ đó  
ü Thay thế mt chui kí hiu phù hp vi vế phi lut bng kí hiu vế trái.  
Không may, nhng thao tác đơn gin trên đây li có chi phí rt cao bi vì nó clp  
đi lp li công vic so khp chui kí hiu vi vế phi ca các lut, điu này tăng gp  
bi công vic cn thiết thc scn phi làm. Để tránh tình trng này, cu trúc dliu  
gi là sơ đồ (chart) được sdng để lưu li các kết quca các quá trình so sánh đã  
được thc hin để tránh đi vic thc hin lp li này.  
Vic so khp luôn để ý ti mt thành phn gi là khoá (key). Để tìm lut phù hp  
vi chui, ta chtìm kiếm nhng lut bt đầu bng trường khoá này để tìm ra lut có vế  
phi trùng khp vi chui kí hiu.  
Gisbn đang phân tích mt câu bt đầu vi ART. Kí hiu ART này được xem  
như là khoá. Như vy, có 2 lut được tìm ra phù hp vi khoá là lut (2)(NP à ART  
N) và lut (3) (NP à ART ADJ N). Để lưu li du vết để có thbiết được trong ln  
phân tích kế tiếp, sdng mt du chm ( ) để chra vtrí đã được xét ti cho đến  
thi đim hin ti. Ta có 2 bn ghi như sau:  
NP à ART ADJ N  
NP à ART  
(2’)  
N
(3’)  
Nếu khoá kế tiếp là ADJ thì lut 4 có thể được bt đầu và và bn ghi 2’ được thay  
đổi như sau:  
NP’ à ART ADJ N (2’’)  
Sơ đồ sbo đảm lưu trtoàn bnhng lut ng viên đã được xét. Nó cũng lưu trữ  
bn ghi ca nhng lut trùng khp chmi phn đầu.Nhng bn ghi này được gi là  
nhng cung đang hot động. Ví d, sau khi tìm ra ART theo sau bi mt ADJ trong ví  
dtrước đây, bn scó mt sơ đồ như hình 2.1.  
9
Chương 2: CÁC CÁCH TIP CN  
ART  
ADJ  
1
2
3
NP à ART ADJ N  
NP à ART N  
NP à ADJ N  
NP à ART ADJ N  
Hình 2.1. Phân tích cú pháp bng phương pháp Bottom-Up  
Ta có thdin gii ý nghĩa ca sơ đồ trên như sau:  
Có 2 lut ng viên đã hoàn tt là ART tvtrí 1 đến 2 và ADJ tvtrí 2 đến 3. Có  
4 cung hot động tương ng vi 4 lut ng viên tương ng vi 4 mũi tên trên hình.  
Chiu ca mũi tên là chiu đi tthp lên cao ( tlá lên gc ca cây cú pháp). Ý nghĩa  
ca các cung trên hình là  
ü Có 1 khnăng cho NP xut hin ti vtrí 1 cn mt ADJ bt đầu ti vtrí 2  
ü Có 1 khnăng cho NP xut hin ti vtrí 2 cn mt N bt đầu ti vtrí 2  
ü Có 1 khnăng cho NP xut hin ti vtrí 2 cn mt N bt đầu ti vtrí 3  
ü Có 1 khnăng cho NP xut hin ti vtrí 1 cn mt N bt đầu vtrí 3  
Phép toán cơ bn ca phép phân tích cú pháp da trên sơ đồ là kết hp các ng cử  
viên đã hoàn tt vi các cung đang hot động. Mt lut mi hoàn tt sẽ được gili  
trong mt danh sách được gi là nht kí cho đến khi nó được thêm vào sơ đồ.  
10  
Chương 2: CÁC CÁCH TIP CN  
2.1.1.4. Thut toán phân tích cú pháp Earley  
Gii thut phân tích cú pháp là mt gii pháp kết hp 2 phương pháp va trình bày ở  
trên. Trước khi đi chi tiết vào thut toán, ta sxét li mt số ưu khuyết đim ca tng  
phương pháp để thy được li đim khi kết hp 2 phương pháp li vi nhau.  
ü Thut toán phân tích cú pháp Top-Down có mt ưu đim là có mt tm nhìn  
bao quát. Mt tcó thnhp nhng vtloi. Tuy nhiên, nếu mt tloi được  
xét được thy không có khnăng hình thành mt cu trúc cú pháp hp lí thì nó  
sẽ được loi bngay lp tc và khnăng tiếp theo sẽ được xét đến. Tuy nhiên,  
bt li ca thut toán phân tích này là nó phi so sánh lp li nhiu ln nhng  
trường ging nhau. Như trong ví dtrên thì mo ta được xét là ART đến 2 ln.  
Điu này làm tăng chi phí lên mt cách không cn thiết.  
ü Trong khí đó, thut toán phân tích cú pháp Bottom-Down chxét mt tvi  
mt tloi chmt ln. Tuy nhiên, bi vì nó xét đến nhãn kí hiu trước nên tt  
ccác nhãn ca mt tsẽ được xét ti mà không xét ngay đến tình hp lí ca từ  
loi này. Đây chính là bt li ca gii thut phân tích cú pháp tdưới lên.  
Thut toán phân tích cú pháp Earley stn dng li đim ca cách tiếp cn tdưới  
lên bng cách đi tgc vlá. Tuy nhiên, để tránh phi xét đi xét li cùng mt tloi  
cho mt tduy nht, gii thut này sẽ đi cùng mt lúc tt ccác hướng (tương ng vi  
các lut ng viên thomãn xét đến thi đim hin ti). Đây chính là đim tương đồng  
ca Earley so vi cách tiếp cn tdưới lên. Như vy nó đã khai thác được ưu đim ca  
hai phương pháp trên và cũng đồng nghĩa vi vic loi bỏ đi nhng khuyết đim ca  
tng phương pháp.  
Bây gita sẽ đi tìm cách tiếp cn cthca phương pháp Earley để thc hin điu  
va trình bày trên.  
Thut toán phân tích Earley:  
Gi n là sttrong câu. Ta xây dng các bng Ii vi i = 0,1,2….,n  
11  
Chương 2: CÁC CÁCH TIP CN  
Bước 1 : Đầu tiên bng I0 được xác định bng tt ccác lut có dng S à , thì  
mt trm có dng S à ,0 sẽ được thêm vào bng I0 gi là mt trm.  
Bước 2 : Nếu [B  
B , 0] thuc I0.  
Bước 3 : Gislà [A B , 0] là mt trm trong I0, ta thêm vào I0, cho tt cả  
các sn sinh trong P có dng B , trm [B , 0] (min là trm này  
chưa có trong I0).  
Bước 4 : Các bng Ij ( vi j = 1…n ) ln lượt được hình thành như sau:Vi mi  
trm [B a , i] trong bng Ij-1 mà trong đó a = aj, ta thêm [B  
, 0] thuc I0, ta thêm [A  
B , 0] cho tt ccác trm [A  
a
, i] vào bng Ij. Lp li các bước 5 và 6 cho ti khi không còn trm nào  
được thêm vào.  
Bước 5 : Gis[A  
có nhng trm nào có dng [B  
thy ta thêm [B , k] vào bng Ij.  
Bước 6 : Gis[A B , i] là mt trm trong bng Ij. Đối vi mi sn sinh B  
trong P, ta thêm [B , j] vào bng Ij.  
, i] là mt bng trong bng Ij. Kim tra trong bng Ii xem  
A , k] hay không, vi mi trm tìm  
A
2.1.1.5. Mng ngpháp lan truyn  
Cho đến lúc này, ta chmi xét đến mt phương pháp biu din ngpháp gi là lut  
phi ngcnh. Bây gita xét đến mt hình thc biu din khác ca ngpháp được sử  
dng rt rng rãi trong các ng dng dó là mng ngpháp lan truyn. Mng ngpháp  
này da trên các nt cung. Có 2 nt đặc bit là nt bt đầu và nt kết thúc.  
Để đơn gin, ta bt đầu bng mt ví dcth: biu din NP (vi các lut đã được  
trình bày trong phn trước bng mng ngpháp).  
NP à ART NP1  
12  
Chương 2: CÁC CÁCH TIP CN  
NP1 à ADJ NP1  
NP1 à N  
Lúc này mng ngpháp slà  
pop  
art  
n
N
NP1  
adj  
NP2  
NP:  
Hình 2.2.Mng ngpháp NP  
Trng thái khi đầu có nhãn là NP. Bt đầu ti trng thái khi to, bn có thể đi  
ngang qua mt cung nếu tloi ca từ đang xét ging vi nhãn ca cung đó. Nếu mt  
cung được chp thun thì vtrí ca tsẽ được cp nht đến tkế tiếp.  
Mt mng lan truyn đơn gin như trên gi là máy trng thái hu hn (finete state  
machines – FSMs). Loi mng này là mt công cụ đắc lc đối vi ngpháp đúng quy  
tc thông thường nhưng không đủ sc mnh để mô ttt ccác ngôn ngcó thbiu  
din dưới dng lut phi ngcnh (CFG). Để được sc mnh mô tca CFGs, ta cn  
quan tâm đến mng ngpháp đệ quy. Cũng ging như mng ngpháp đơn gin, tuy  
nhiên mng ngpháp đệ quy có mt đim mi hơn là nó cho phép các cung có thlà  
mt mng khác (tương ng vi mt nhãn không kết thúc) thay vì là mt nhãn tloi).  
Như trong ví dtrong hình 2.3, trường tloi sẽ được biu din là chthường,  
trường tham chiếu đến mt mng ngpháp khác được kí hiu là chin hoa. nt S và  
S1 được ni vi nhau bng mt cung NP- đây chính là mng ngpháp được biu din  
trong hình 2.2.  
13  
Chương 2: CÁC CÁCH TIP CN  
NP  
verb  
NP  
pop  
S
S1  
S2  
S3  
Hình 2.3. Mng ngpháp đệ quy  
Loi cung  
Ví dụ  
Ý nghĩa  
CAT  
Verb  
Thành công chkhi từ đang xét có thể đánh nhãn  
CAT  
WRD  
PUSH  
JUMP  
POP  
Of  
Thành công chkhi từ đang xét ging vi WRD  
Chthành công khi mng con thành công  
Luôn thành công  
NP  
Jump  
Pop  
Thành công, trvdu hiu thành công ca mng  
Bng 2.2.Ý nghĩa ca các cung trong mng ngpháp  
Thut toán phân tích cú pháp Top-Down sdng mng ngpháp lan truyn đệ quy:  
Các khái nim:  
ü Vtrí hin ti: Con trchỉ đến tkế tiếp được xét.  
ü Nt hin ti: Nt đang xét đến trong mng ngpháp.  
ü Đim trv: Mt ngăn xếp ca nhng nt trong mng khác. Bn schtiếp  
tc nếu mng này trvgiá trthành công (pop).  
Ging như cách tiếp cn ttrên xung truyn thng, nhưng thay vì xét tính hp lệ  
ca mt lut thì trong mng ngpháp này, ta xét đến vic có thdi chuyn qua mt  
cung có được hay không  
Trường hp 1 : Nếu tên cung là nhãn tloi và tkế tiếp trong câu thuc nhãn  
tloi đó  
Thì  
14  
Chương 2: CÁC CÁCH TIP CN  
ü Cp nht vtrí hin ti ti tkế tiếp.  
ü Cp nht nt hin ti ti nt đích ca cung hin ti.  
Trường hp 2 : Nếu cung là dng cung đưa vào (push) mt mng N  
Thì  
ü Thêm đích ca cung đến đim trv.  
ü Cp nht nt hin ti là nt đầu tiên trong mng N.  
Trường hp 3 : Nếu cung thuc dng cung đưa ra (pop) và đim trvkhác  
rng  
Thì Xoá phn tử đầu tiên trong đim trvvà ly đó làm nt  
hin ti.  
Trường hp 4 : Nếu cung thuc dng cung đưa ra (pop) và đim trvlà rng  
và không còn tnào bbỏ đi.  
Thì phân tích cú pháp thành công.  
2.1.2. Phương pháp TBL (Transformation-Based Error-Driven  
Learning)  
Phương pháp TBL được gii thiu ln đầu tiên bi Eric Brill vào năm 1993. Đến  
năm 1995 thì nó được công brng rãi. Đây là mt phương pháp rt mnh trong lĩnh  
vc ngôn nghc và được áp dng để gii quyết nhiu bài toán ngôn ngkhác nhau.  
Ý tưởng cơ bn ca phương pháp TBL là da vào mt ngliu đã được đánh nhãn  
đúng, nó cgng tự đi tìm nhng lut để sa nhng li sai theo nguyên lí tham lam.  
Nhng lut được rút ra bi TBL không ging vi nhng lut phi ngcnh các  
phương pháp trước. Nó là nhng lut tương tác.  
Gii thut TBL có 2 giai đon riêng bit là giai đon hc và giai đon chy.  
Trong giai đon hc, da vào ngliu đã được đánh nhãn, hthng sctìm ra các  
lut tương tác để có thể đánh nhãn càng ging càng tt.  
15  
Chương 2: CÁC CÁCH TIP CN  
Ngược li, trong giai đon chy, da vào blut đã được rút ra để đánh nhãn cho  
mt tp văn bn chưa được đánh nhãn.  
Quá trình hc:  
Đầu tin, ngliu đã được đánh nhãn đúng sẽ được bnhãn đi to thành mt văn  
bn không có nhãn.  
Kế đó, văn bn không có nhãn này sẽ được đánh nhãn ban đầu gi là nhãn ngây thơ  
hay nhãn cơ s. Nhãn ngây thơ có thlà sai rt nhiu theo cách đánh nhãn ngu nhiên  
hay cũng có khi khá chính xác nếu sdng mt chương trình đánh nhãn nào đó. Trong  
lĩnh vc phân tích cú pháp, nhãn cơ scó thể được đánh mt cách đơn gin theo cách  
phân câu thành nhng ngtheo nguyên tc nhphân.  
Có 2 điu cn lưu ý khi đánh nhãn cơ s:  
ü Không nên sdng nhng đặc trưng ca ngôn ng, điu này làm gim tính  
cơ động ca chương trình.  
ü Hãy để cho chương trình thc ra nhng lut hu ích, không nên tn quá  
nhiu thi gian để txlí.  
Da vào các mu lut đã được to sn, các lut ng viên sẽ được hình thành và được  
áp dng vào văn bn đã được đánh nhãn cơ s. Khác vi các lut CFG đã được trình  
bày trong các chương trước, lut TBL là các lut chuyn đổi dùng để thay đổi nhãn ca  
t. Quá trình đánh nhãn cú pháp slà quá trình thêm và xoá các nhãn này.  
Tng lut ng viên, khi đưa vào áp dng thtrên văn bn đã được đánh nhãn cơ sở  
theo tng câu mt. Đim sẽ được chm cho mi lut làm căn ccho vic chn la lut  
tt nht. Quy tc chm đim như sau:  
ü Nếu lut không làm thay đổi gì thì không thay đổi đim.  
ü Nếu lut sa đúng thành sai thì cng mt đim.  
ü Nếu lut sa sai thành đúng thì trmt đim.  
ü Nếu lut sa sai thành sai thì không thay đổi đim.  
16  
Chương 2: CÁC CÁCH TIP CN  
Sau khi tt ccác lut đã được áp dng cho tt ccác câu trong văn bn, chn ra  
mt lut có đim ln nht để gili nếu đim nó vượt mt ngưỡng cho trước. Dùng  
lut này để sa nhãn cho văn bn đã được đánh nhãn cơ s. Bi vì đim cua lut này  
luôn dương (bi ngưỡng là sdương) nên độ chính xác ca văn bn bây giờ đã được  
tăng lên.  
Quá trình trên li được lp li: tng lut sẽ được áp dng thtrên văn bn đánh nhãn  
cơ sở đã được sa li bi lut được chn. Lut tt nht li được chn ra…  
Quá trình hc sngng khi ti mt bước, số đim ca lut tt nht không vượt quá  
mt ngưỡng cho phép. Nếu ngưỡng này được chn quá ln, slut rút ra skhông  
được nhiu và độ chính xác không được cao. Ngược li nếu ngưỡng được chn quá  
nhsdn đến tình trng quá luyn.  
17  

Tải về để xem bản đầy đủ

pdf 164 trang yennguyen 15/05/2025 140
Bạn đang xem 30 trang mẫu của tài liệu "Luận văn Gán nhãn phân tích cú pháp quan hệ cho song ngữ Anh Việt thông qua liên kết ngữ", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfluan_van_gan_nhan_phan_tich_cu_phap_quan_he_cho_song_ngu_anh.pdf