Luận văn Xây dựng chương trình chuyển đổi cây cú pháp trong hệ dịch tự động Anh - Việt

TRƯỜNG ĐẠI HC KHOA HC TNHIÊN  
KHOA CÔNG NGHTHÔNG TIN  
BMÔN CÔNG NGHTRI THC  
^ ]  
NGUYN LƯU THÙY NGÂN - 9912621  
ĐỖ XUÂN QUANG - 9912652  
XÂY DNG CHƯƠNG TRÌNH  
CHUYN ĐỔI CÂY CÚ PHÁP TRONG  
HDCH TỰ ĐỘNG ANH - VIT  
LUN VĂN CNHÂN TIN HC  
GIÁO VIÊN HƯỚNG DN  
TS. ĐINH ĐIN  
NIÊN KHÓA 1999-2003  
Lun văn tt nghip  
Li cm tạ  
Li đầu tiên chúng em xin chân thành cm ơn thy Đinh  
Đin, người đã trc tiếp hướng dn chúng em hoàn thành lun văn  
này. Thy là người đã truyn thcho chúng em rt nhiu kiến thc  
vtin hc và ngôn nghc, giúp chúng em có được hiu biết sâu  
hơn vmt trong các ng dng có ý nghĩa vô cùng to ln trong  
cuc sng ca tin hc – vn đề dch máy.  
Chúng em cũng xin chân thành cm ơn các thy cô trong  
khoa Công nghthông tin đã tn tình chbo và giúp đỡ cho  
chúng em trong sut thi gian chúng em hc đại hc và trong quá  
trình chúng em thc hin lun văn.  
Chúng con xin chân thành cm ơn ba m, các anh và nhng  
người thân trong gia đình đã nuôi dy, to mi điu kin tt nht  
cho chúng con hc tp và động viên chúng con trong thi gian  
thc hin lun văn.  
Và cui cùng, chúng tôi xin gi li cm ơn đến tt cbn bè  
và nht là các bn trong nhóm VCL (Vietnamese Computational  
Linguistics), nhng người đã htrchúng tôi trong quá trình  
chúng tôi hoàn thin lun văn này.  
Tp. HChí Minh, tháng 07 năm 2003  
Nguyn Lưu Thùy Ngân - 9912621  
Đỗ Xuân Quang - 9912652  
Trang 2  
Lun văn tt nghip  
NHN XÉT CA GIÁO VIÊN HƯỚNG DN  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
Tp. HChí Minh, tháng 07 năm 2003  
TS. Đinh Đin  
Trang 3  
Lun văn tt nghip  
NHN XÉT CA GIÁO VIÊN PHN BIN  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
Tp. HChí Minh, tháng 07 năm 2003  
Giáo viên phn bin  
Trang 4  
Lun văn tt nghip  
Li nói đầu  
Cho đến nay, sau hơn 50 năm phát trin, dch máy chng tlà mt ng dng  
vô cùng thiết thc, đồng thi cũng là mt bài toán khá hóc búa đặt ra cho các nhà  
khoa hc trên toàn thế gii. Từ đầu thp niên 1960, các nhà khoa hc đã đúc kết li  
ba chiến lược dch máy cơ bn, đó là dch trc tiếp, dch thông qua ngôn ngtrung  
gian và dch da trên chuyn đổi. Và qua thc tế, chiến lược dch da trên chuyn  
đổi đã khng định được tính hiu quvà tim năng ca nó, và đây cũng là cách tiếp  
cn mà chúng em đã và đang theo đui để xây dng mt hdch tự động ttiếng  
Anh sang tiếng Vit.  
Trong hdch da trên schuyn đổi, khi chuyn đổi cây cú pháp (cu trúc)  
gimt vai trò quan trng, quyết định cht lượng hdch. Vì lý do đó, chúng em đã  
quyết định chn “Xây dng chương trình chuyn đổi cây cú pháp trong hdch  
Anh-Vit” làm đề tài lun văn tt nghip cnhân ca mình. Khi chuyn đổi cây cú  
pháp đảm nhim vic thay đổi trt t, chèn, xoá các thành phn trong cây cú pháp  
ca câu tiếng Anh sao cho sau khi hoàn tt vic gn nghĩa, ta sthu được câu tiếng  
Vit có trt tthp lý.  
Lun văn được tchc thành các phn chính sau:  
™ Chương 1: Gii thiu tm quan trng, mc tiêu, phm vi ca đề tài, cơ sở  
lý thuyết ngôn nghc, tin hc và hướng tiếp cn vn đề.  
™ Chương 2: Đim qua các cách tiếp cn chuyn đổi cu trúc.  
™ Chương 3: Thut toán nn tng, mô hình hc và mô hình áp dng chuyn  
đổi cây cú pháp.  
™ Chương 4: Thiết kế – Cài đặt  
™ Chương 5: Thnghim – đánh giá  
™ Chương 6: Kết qu– Kết lun – Hướng phát trin  
™ Phn phlc. Tài liu tham kho.  
Trang 5  
Lun văn tt nghip  
Mc lc  
Li nói đầu.......................................................................................................5  
Mc lc.............................................................................................................6  
Danh sách các hình.......................................................................................11  
Danh sách các bng.......................................................................................13  
Chương 1........................................................................................................14  
TNG QUAN VCHUYN ĐỔI CÂY CÚ PHÁP......................................14  
1.1  
1.2  
Đặt vn đ.......................................................................................14  
Các chiến lược dch máy................................................................16  
1.1.1 Chiến lược dch trc tiếp.......................................................................16  
1.1.2 Chiến lược dch da trên ngôn ngtrung gian .....................................17  
1.1.3 Chiến lược dch da trên schuyn đổi ...............................................18  
1.2  
Vai trò ca chuyn đổi cây cú pháp trong cách tiếp cn da trên  
chuyn đổi..................................................................................................20  
1.3  
Cơ slý thuyết................................................................................22  
1.3.1 Cơ slý thuyết ngôn nghc ca vic chuyn đổi ..............................23  
1.3.2 Cơ slý thuyết tin hc - Hướng tiếp cn vn đề ..................................33  
Chương 2........................................................................................................35  
CÁC HƯỚNG TIP CN CHUYN ĐỔI CU TRÚC TRONG DCH  
MÁY................................................................................................................35  
2.1  
Hướng tiếp cn da trên lut cố định ..........................................35  
2.1.1 Cơ chế chuyn đổi ca cách tiếp cn da trên lut cố định..................35  
2.1.2 Nhn xét ................................................................................................38  
Trang 6  
Lun văn tt nghip  
2.2  
Hướng tiếp cn sdng case-frame.............................................39  
2.2.1 Chuyn đổi các thông tin cp độ câu ....................................................40  
2.2.2 Chuyn đổi ngữ động t........................................................................41  
2.2.3 Schuyn đổi ca định ng, bng.....................................................42  
2.2.4 Tự đin chuyn đổi................................................................................43  
2.2.5 Nhn xét ................................................................................................44  
2.3  
Hướng tiếp cn sdng TAG đồng b(STAG)..........................44  
2.3.1 Văn phm TAG.....................................................................................45  
2.3.2 TAG đồng b(STAG) ..........................................................................49  
2.3.3 Nhn xét ................................................................................................52  
2.4  
Cách tiếp cn phân tích ngpháp song song ..............................53  
2.4.1 Ngpháp chuyn dch đảo có thng kê (SITG) ...................................53  
2.4.2 Thut toán phân tích cú pháp song song vi SITG...............................55  
2.4.3 Đánh nhãn cu trúc................................................................................58  
2.4.4 Chuyn đổi cây cú pháp song song cho chai ngôn ng.....................58  
2.4.5 Nhn xét ................................................................................................59  
2.5  
Cách tiếp cn da trên cu trúc vt- đối s.............................60  
2.5.1 Rút trích các cu trúc vt- đối s.......................................................60  
2.5.2 Khi chuyn đổi cu trúc ......................................................................62  
2.5.3 Nhn xét ................................................................................................64  
2.6  
Tng kết chương ............................................................................65  
Chương 3........................................................................................................66  
MÔ HÌNH CHUYN ĐỔI CÂY CÚ PHÁP .................................................66  
3.1  
Phương pháp hc hướng li da trên schuyn trng thái ......66  
3.1.1 Ý tưởng .................................................................................................66  
3.1.2 Thut toán hc TBL ca Eric Brill........................................................68  
3.1.3 Nhn xét ................................................................................................70  
Trang 7  
Lun văn tt nghip  
3.2  
Thut toán hc nhanh FnTBL......................................................71  
3.2.1 Hình thc hóa TBL ...............................................................................72  
3.2.2 Thut toán FnTBL.................................................................................73  
3.3  
Mô hình chuyn đổi cây cú pháp sdng thut toán FnTBL ...78  
3.3.1 Mô hình áp dng chuyn đổi cây cú pháp ............................................80  
3.3.2 Mô hình hc lut chuyn đổi bng phương pháp hc FnTBL..............82  
3.4  
Nâng cao khnăng mrng cho mô hình hc ............................95  
Chương 4........................................................................................................97  
CÀI ĐẶT CHƯƠNG TRÌNH ........................................................................97  
4.1  
Thiết kế ...........................................................................................97  
4.1.1 Mô hình tng th...................................................................................97  
4.2  
Thut toán gán nhãn cơ scho ngliu ......................................99  
4.2.1 Thut toán..............................................................................................99  
4.2.2 Xây dng cây cú pháp...........................................................................99  
4.2.3 Xây dng cây quan h.........................................................................103  
4.2.4 Thut toán chuyn đổi theo nguyên tc ..............................................105  
4.3  
Hc chuyn đổi cùng cp.............................................................106  
4.3.1 Xây dng ngliu hc........................................................................106  
4.3.2 Xây dng khung lut cho bhc chuyn đổi cùng cp ......................108  
4.3.3 Sơ đồ lp ca chương trình hc ..........................................................114  
4.3.4 Xây dng blut (giai đon hc cùng cp) ........................................114  
4.3.5 Áp dng blut chuyn đổi cùng cp.................................................116  
4.4  
Hc chuyn đổi khác cp.............................................................117  
4.4.1 Xây dng ngliu hc........................................................................117  
4.4.2 Xây dng khung lut cho quá trình hc chuyn đổi khác cp............120  
4.4.3 Sơ đồ lp ca chương trình hc ..........................................................125  
4.4.4 Xây dng blut (giai đon hc khác cp) ........................................125  
Trang 8  
Lun văn tt nghip  
4.4.5 Áp dng blut chuyn đổi khác cp.................................................127  
Chương 5......................................................................................................128  
THNGHIM – ĐÁNH GIÁ ....................................................................128  
5.1  
Thnghim...................................................................................128  
5.1.1 Độ đo sdng .....................................................................................128  
5.1.2 Kết quhc rút lut chuyn đổi ..........................................................129  
5.1.3 Mt skết quchuyn đổi ..................................................................131  
5.2  
Đánh giá........................................................................................134  
5.2.1 Ngliu thnghim ...........................................................................134  
5.2.2 Nhn xét ..............................................................................................135  
Chương 6......................................................................................................137  
TNG KT ..................................................................................................137  
6.1  
6.2  
6.3  
Kết qu..........................................................................................137  
Hướng phát trin..........................................................................137  
Kết lun.........................................................................................138  
PHLC 1..................................................................................................139  
KHUNG LUT VÀ MT SLUT CÙNG CP......................................139  
PHLC 2..................................................................................................141  
KHUNG LUT VÀ MT SLUT KHÁC CP......................................141  
PHLC 3..................................................................................................142  
MT SKT QUDCH SDNG KHI CHUYN ĐỔI CÂY CÚ  
PHÁP VCLTRANSFER..............................................................................142  
PHLC 4..................................................................................................147  
MT SCÂU DCH CA HAI HDCH ...............................................147  
PHLC 5..................................................................................................153  
HTHNG NHÃN NGPHÁP ...............................................................153  
Trang 9  
Lun văn tt nghip  
PHLC 6..................................................................................................156  
CÁC NHÃN QUAN HNGPHÁP .........................................................156  
TÀI LIU THAM KHO............................................................................157  
Trang 10  
Lun văn tt nghip  
Danh sách các hình  
Hình 1: Mô hình dch trc tiếp .................................................................................. 16  
Hình 2: Mô hình dch da trên ngôn ngtrung gian................................................. 17  
Hình 3: Mô hình dch da trên schuyn đổi........................................................... 18  
Hình 4: Hình tháp minh ha các chiến lược dch máy.............................................. 20  
Hình 5: Cây cú pháp ca câu “I have already read that interesting book.” .............. 21  
Hình 6: So sánh trt tự định ngtiếng Anh và tiếng Vit ........................................ 26  
Hình 7: Áp dng lut cố định để thc hin vic chuyn đổi cu trúc....................... 36  
Hình 8: Trường hp chuyn đổi khác cp lut cố định không ththc hin được... 37  
Hình 9: Khnăng chuyn đổi cú pháp ca lut cố định............................................ 38  
Hình 10: Gin đồ cây khi to và cây phtrca TAG........................................... 46  
Hình 11: Tác tkết hp ............................................................................................. 47  
Hình 12: Tác tthay thế............................................................................................. 48  
Hình 13: Mt smu cây sơ cp trong tự đin chuyn đổi cây Anh-Pháp .............. 50  
Hình 14: Cây phân tích ngpháp chuyn dch đảo.. ................................................ 55  
Hình 15: Chuyn đổi khung gia các ngôn ng........................................................ 63  
Hình 16: Sơ đồ phương pháp hc TBL tng quát..................................................... 70  
Hình 17: Mt ví dminh hochuyn đổi cây cú pháp ............................................ 79  
Hình 18: Mô hình áp dng chuyn đổi cây cú pháp.................................................. 81  
Hình 19: Mô hình hc lut chuyn đổi cây cú pháp theo thut toán FnTBL............ 82  
Hình 20: Ví dvcác quan hngpháp trong ng.................................................. 85  
Trang 11  
Lun văn tt nghip  
Hình 21: Xây dng ngtiếng Vit tcác quan hngpháp.................................... 86  
Hình 22: Lưu đồ thut toán gán nhãn chuyn đổi cơ scho ngliu ...................... 87  
Hình 23: Lưu đồ thut toán hc lut chuyn đổi  
cùng cp – FnTBL ................. 90  
Hình 24: Lưu đồ hc lut chuyn đổi khác cp (FnTBL)......................................... 94  
Hình 25: Mô hình tng thca quá trình hc lut chuyn đổi Anh-Vit ................. 97  
Hình 26: Kết quphân tích cú pháp: “Last week, I saw a very interesting film.”..100  
Hình 27: Cây quan hca câu “Last week, I saw a very interesting film.”............104  
Hình 28: Cây tiếng Anh đã chuyn đổi các thành phn đúng vi tiếng Vit..........107  
Hình 29: Cây cú pháp ca câu “What is a computer ?” ..........................................111  
Hình 30: Cây cú pháp ca (E) sau khi được áp dng lut R...................................113  
Hình 31: Sơ đồ lp khi hc lut chuyn đổi cùng cp ..........................................114  
Hình 32: Mô hình áp dng tp lut chuyn đổi cùng cp .......................................116  
Hình 33: Cây cú pháp ca câu tiếng Anh “It is a good type of book....................118  
Hình 34: Mt cây cú pháp tiếng Anh sau khi chuyn sang cu trúc tiếng Vit......119  
Hình 35: Mt phn cây cú pháp vi đường đi ca thành phn [ADVP].................123  
Hình 36: Sơ đồ lp khi hc lut chuyn đổi khác cp...........................................125  
Hình 37: Mô hình áp dng tp lut chuyn đổi khác cp........................................127  
Hình 38: Đánh giá tp lut hc chuyn đổi cùng cp..............................................130  
Hình 39: Đánh giá tp lut hc chuyn đổi khác cp .............................................131  
Trang 12  
Lun văn tt nghip  
Danh sách các bng  
Bng 1: Trt tcác thành phn trong ngdanh ttiếng Anh................................... 27  
Bng 2: Trt tcác thành phn trong ngdanh ttiếng Vit................................... 28  
Bng 3: Danh sách 23 cu trúc vt- đối strong tiếng Hoa .................................. 61  
Bng 4: Mt squan hngpháp được ánh xcùng các ngoi l.......................... 84  
Bng 5: Các quan htrong câu tiếng Anh...............................................................103  
Bng 6: Ý nghĩa các ký hiu dùng trong mô tngliu hc giai đon 1...............108  
Bng 7: Các thành phn trong khung lut hc bước 1 ............................................109  
Bng 8: Các khung lut dùng trong hc lut chuyn đổi cùng cp.........................109  
Bng 9: Ý nghĩa các khuôn mu trong khung lut..................................................110  
Bng 10: Các đặc trưng ngôn ngca các mu rút ra tcây cú pháp tiếng Anh...112  
Bng 11: Các thành phn trong khung lut hc chuyn đổi khác cp ....................120  
Bng 12: Các khung lut dùng trong hc lut chuyn đổi khác cp.......................121  
Bng 13: Ý nghĩa các thành phn trong khung lut bước 2....................................122  
Bng 14: Mt phn cây cú pháp minh hovic đánh ID tương đối cho route.......123  
Bng 15: Tóm tt kết quhc lut chuyn đổi cùng cp ........................................130  
Bng 16: Tóm tt kết quhc lut chuyn đổi cùng cp ........................................131  
Bng 17: Kết quthnghim vic áp dng chuyn đổi cây cú pháp.....................135  
Trang 13  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
Chương 1  
TNG QUAN VCHUYN ĐI CÂY  
CÚ PHÁP  
Chương này gii thiu về đề tài lun văn - mc đích và phm vi thc hin.  
Phn 2 ca chương trình bày mt cách tng quát vchuyn đổi cây cú pháp: vai trò,  
vtrí ca khi chuyn đổi cây cú pháp trong hdch Anh-Vit. Ngoài ra, nhng  
khái nim then cht liên quan đến đề tài, cũng như các cơ svlý thuyết ngôn ngữ  
hc và tin hc, là nn tng để chúng em thc hin lun văn, cũng ln lượt được nêu  
rõ trong phn 3 ca chương.  
1.1 Đặt vn đề  
Chế to ra mt loi máy có khnăng dch tự động để giúp cho con người vượt  
qua rào cn ngôn nglà mt mơ ước ca loài người đã có tthế kXVII, rt lâu  
trước khi máy tính đin tra đời. Và chng bao lâu sau khi máy tính đin tử đầu  
tiên ra đời, bên cnh nhng ng dng tính toán trong lĩnh vc toán hc và vt lý,  
người ta đã nghĩ ngay đến vic sdng “bnão máy tính” cho nhng ng dng  
không liên quan đến s, trong đó có vn đề dch tự động. Ln đầu tiên, vic sdng  
máy tính đin tử để dch văn bn tngôn ngnày sang ngôn ngkhác được đề cp  
đến trong nhng cuc tho lun gia Andrew D. Booth và Warren Weaver vào năm  
1946. Vượt qua nhiu trngi vlý thuyết và công ngh, Booth và các cng sca  
ông đã cho ra mt “hdch da trên tự đin” đầu tiên ti hi nghca MIT vào năm  
1952.  
Tbước khi đầu đó, dch máy đã ngày càng thu hút được squan tâm nghiên  
cu ca nhiu nhà khoa hc máy tính, nhiu nhà ngôn nghc,... và được cng  
đồng thế gii tha nhn hiu quto ln ca nó. Dch máy không nhng giúp cho  
Trang 14  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
vic dch các tài liu, dch các trang Web nhanh chóng và ít tn công sc hơn, vic  
giao lưu trao đổi văn hoá gia các nước ddàng hơn, mà còn có ý nghĩa trong vic  
bo mt cho tài liu quan trng cn dch thut.  
Tuy vy, để được mt hdch tự động cho kết qudch tt là cmt quá  
trình nghiên cu và xây dng cc kphc tp, phthuc rt nhiu vào các ngôn  
ngcn dch. Điu này khiến cho dch máy đã tng lâm vào mt thi k“khng  
hong” vphương pháp xây dng mt hdch. Tnăm 1960, sau mt thp kra  
đời, dch máy đã có nhiu chiến lược, phương pháp rõ ràng hơn cũng như mc tiêu  
ca hdch máy được đặt ra sát vi thc tế hơn. Người ta nhn thy rng tham vng  
xây dng được mt hdch tự động có khnăng dch tt cmi câu ca mt ngôn  
ngtnhiên là điu không tưởng, mc tiêu hdch phi thu gn li trong mt lĩnh  
vc hp để hn chế bt tính nhp nhng ca ngôn ng.  
Có 3 chiến lược dch máy, đó là :  
™ Dch trc tiếp  
™ Dch da trên ngôn ngtrung gian  
™ Dch da trên chuyn đổi  
Cho đến nay, các hdch da trên chuyn đổi được đánh giá cao vì tính khả  
thi ca nó. Tùy thuc vào hai ngôn ngcn dch mà hthng có ththiết kế các  
khi phân tích, chuyn đổi, tái to vi độ phc tp thích hp. Mt shdch da  
trên chuyn đổi tiêu biu như, hdch Anh-Pháp METEO được xây dng bi đại  
hc Montreal - TAUM, được đưa vào sdng để dch các bn tin dbáo thi tiết;  
hdch GETA (Đại hc Grenoble, 1971-),...  
Trong các hdch da trên chuyn đổi, bước chuyn đổi là bước quan trng  
nht, givai trò quyết định cht lượng hdch. Chuyn đổi này bao gm hai phn  
chuyn đổi chính, đó là chuyn đổi tvng và chuyn đổi cu trúc. Chuyn đổi từ  
vng là quá trình chn nghĩa đúng cho các từ ở ngôn ngngun thhin sang từ  
tương ng ca ngôn ngữ đích. Còn chuyn đổi cu trúc là quá trình sp xếp li,  
thêm bt, thay thế các thành phn cu trúc ca câu ngôn ngngun để được  
cu trúc tương ng ngôn ngữ đích.  
Trang 15  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
Trong lun văn này, chúng em tìm hiu và xây dng chương trình chuyn đổi  
cây cú pháp Anh-Vit, đóng vai trò là mt khi chuyn đổi cu trúc trong hdch tự  
động Anh-Vit da trên schuyn đổi. Như đã trình bày phn trên, vic thc hin  
mt chương trình có khnăng bao quát tt ccác cu trúc chuyn đổi có thcó là  
mt vn đề không tưởng trong xlý ngôn ngtnhiên. Do đó, chúng em gii hn  
đề tài chuyn đổi cây cú pháp này các văn bn thuc lĩnh vc khoa hc kthut.  
Kết quca chương trình chuyn đổi cây cú pháp Anh - Vit thhin gián tiếp  
qua trt tttrong câu tiếng Vit được dch ra (không quan tâm đến nghĩa ca từ  
chn có thc schính xác hay không).  
Trong phn tiếp theo, chúng em trình bày tóm tt vba chiến lược dch máy  
để chúng ta có thcó mt cái nhìn bao quát hơn vhdch da trên schuyn đổi,  
thy được các ưu đim ca nó so vi hai chiến dch còn li.  
1.2 Các chiến lược dch máy  
1.1.1 Chiến lược dch trc tiếp  
Chiến lược này có cách tiếp cn dch máy đơn gin nht. Thiết kế ca hxử  
lý các hthng này rt đơn gin, bao gm 3 khi chính :  
™ Phân tích hình thái : đảm nhn vic đưa ttrong ngôn ngngun vdng  
gc ca nó để có ththc hin vic tra tự đin.  
™ Tra từ đin song ng: xác định ttương ng tgc trong ngôn ngữ đích.  
™ Sp xếp trt ttừ đơn gin : quá trình này thường da trên nhng qui lut  
cố định và đơn gin vì ta không thxây dng lut xlý trt tphc tp  
hơn nếu không có nhng phân tích ngôn ngngun cn thiết.  
Phân tích  
hình thái  
Tra từ đin  
song ngữ  
Sp xếp  
trt tự đơn  
gin  
Văn bn  
ngun  
Văn bn  
kết quả  
Hình 1: Mô hình dch trc tiếp  
Trang 16  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
Các hdch này hn chế ti đa các bước phân tích cn thiết để gii quyết nhp  
nhng, cũng như đơn gin hoá cvic xác định các thành phn tương ng ngôn  
ngữ đích thông qua tự đin ln xác định trt tự đúng ca các ttrong ngôn ngữ đích.  
Gia khi phân tích và tái to câu không có bt kbước trung gian nào. Các từ  
trong văn bn ngun chqua mt bước phân tích hình thái duy nht. Cách làm này  
chphù hp khi ngôn ngngun và đích có rt nhiu đim ging nhau như tiếng  
Anh và tiếng Tây Ban Nha, không phù hp vi phn ln ngôn ngkhác.  
1.1.2 Chiến lược dch da trên ngôn ngtrung gian  
Trong chiến lược này, ngnghĩa ca văn bn ngôn ngngun được biu din  
li theo mt ngôn ngtrung gian, và văn bn ngôn ngữ đích cũng được phát sinh từ  
ngôn ngtrung gian này. Do đó, chcó duy nht mt cách biu din cho mt đơn vị  
ngnghĩa, bt kngôn nggc ca nó là gì.  
Ngôn ngữ  
trung gian  
Văn bn  
ngun  
Văn bn  
kết quả  
Phân tích  
Phát sinh  
Hình 2: Mô hình dch da trên ngôn ngtrung gian  
Xlý trong hthng da trên ngôn ngtrung gian bao gm hai bước quan  
trng, đó là :  
™ Phân tích văn bn ngun để biu din li dưới dng thc ca mt ngôn ngữ  
trung gian.  
™ Sdng nhng đơn vngnghĩa và cu trúc cú pháp ca ngôn ngữ đích để  
phát sinh văn bn kết qutcách biu din theo dng ngôn ngtrung gian.  
Ngôn ngtrung gian được sdng trong nhng hdch như vy đòi hi phi  
đủ phong phú để biu din được tt ccác đơn vtvng và cú pháp ca các ngôn  
ngliên quan trong quá trình dch. Do đó, vic tự định nghĩa hay tìm kiếm mt  
Trang 17  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
ngôn ngtrung gian thoả điu kin là điu cc kkhó khăn. Hơn na, tt cnhng  
thông tin cn thiết trong bước tái to phi nm trong ngôn ngtrung gian này.  
1.1.3 Chiến lược dch da trên schuyn đổi  
Văn bn ngun  
Ngpháp ngôn  
ngngun / Tự  
đin  
PHÂN TÍCH  
Biu din trung gian ca  
ngôn ngngun  
Lut chuyn đổi /  
Tự đin  
CHUYN ĐỔI  
Biu din trung gian ca  
ngôn ngữ đích  
Ngpháp ngôn  
ngữ đích / Tự đin  
PHÁT SINH  
Văn bn kết quả  
Hình 3: Mô hình dch da trên schuyn đổi  
Chiến lược này chia quá trình dch thành 3 giai đon  
™ Phân tích  
™ Chuyn đổi  
™ Phát sinh  
Chiến lược dch da trên chuyn đổi phân tích và biu din li câu ngôn ngữ  
ngun theo mt dng thc trung gian thích hp cho vic chuyn đổi. Khi phát sinh  
câu snhn dng thc trung gian ca ngôn ngữ đích và to câu ngôn ngữ đích. Sự  
chuyn đổi gia hai dng thc trung gian được thc hin nhkhi chuyn đổi, khi  
này sdng nhng tự đin chuyn đổi cha các tương quan tvng gia hai ngôn  
ngngun và đích và mt tp hp các lut chuyn đổi.  
Trang 18  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
Quá trình phân tích có thể được thc hin nhiu cp độ khác nhau tùy thuc  
vào hai ngôn ng, chng hn như phân tích hình thái, cu trúc, ngnghĩa,... Các cp  
độ phân tích khác nhau dn đến nhiu cp độ ca dng thc trung gian. Nhng dng  
thc này cha các thành phn tvng ngun và đích, phn ánh cu trúc ca hai  
ngôn ng. Có nhiu loi biu din khác nhau được sdng trong các hdch da  
trên schuyn đổi như: cây phthuc, cu trúc ng, ...  
Chiến lược dch máy da trên chuyn đổi có nhiu ưu đim. Trước hết, tính  
tương đồng gia ngôn ngngun và đích càng cao thì bước chuyn đổi càng đơn  
gin. Tương t, giai đon phân tích và phát sinh cũng sẽ đơn gin hơn so vi các hệ  
dch da trên ngôn ngtrung gian.  
Trong ba chiến lược nói trên thì chiến lược da trên schuyn đổi được quan  
tâm nhiu nht vì tính khthi cao và rt linh động. Bng chng là có nhiu hdch  
da trên schuyn đổi ra đời và hot động hiu qu.[21]  
Trang 19  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
1.2 Vai trò ca chuyn đổi cây cú pháp trong cách tiếp  
cn da trên chuyn đổi  
Ngôn ngtrung gian  
Chuyn đổi  
Dch trc tiếp  
Văn bn đích  
Văn bn ngun  
Hình 4: Hình tháp minh ha các chiến lược dch máy1  
Trên lý thuyết, phân tích ngpháp càng sâu, gánh nng bước chuyn đổi  
càng gim. Hai vn đề ln mà khi chuyn đổi cn gii quyết là chuyn đổi tvng  
và chuyn đổi cu trúc.  
Chuyn đổi tvng là thay thế các tca văn bn ngun bng các ttương  
ng ca ngôn ngữ đích. Công vic này srt đơn gin nếu như mi tca ngôn ngữ  
ngun tương ng vi mt tduy nht ngôn ngữ đích nhưng trên thc tế, mi từ ở  
ngôn ngngun có thkhông có ttương ng hoc có nhiu ttương ng ngôn  
ngữ đích. Chn la như thế nào cho đúng vào ngcnh ca câu cn dch là vn đề  
mà chuyn đổi tvng phi gii quyết.  
Chuyn đổi cu trúc là bước sp xếp các thành phn ngpháp ca ngôn ngữ  
ngun, bao gm cchèn, xoá các thành phn sao cho kết qudch tuân thnhng  
lut ngpháp ca ngôn ngữ đích, văn bn kết xut sgn vi ngôn ngtnhiên  
1 Hình tháp này được nhóm GETA đưa ra vào năm 1968  
Trang 20  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
hơn mà vn giữ đúng ngnghĩa và sc thái ca văn bn gc. Như vy khi chuyn  
đổi cu trúc ginhim vthc hin nhng thay đổi cn thiết khi biu din trung  
gian ca ngôn ngngun không thánh xtrc tiếp thành cách biu din tương tự  
trong ngôn ngữ đích do có skhác bit vcu trúc ca hai ngôn ng.  
Cu trúc cú pháp ca mt câu được biu din dưới dng cây cú pháp. Chuyn  
đổi cu trúc ca mt câu tngôn ngngun sang ngôn ngữ đích tc là quá trình xác  
định mi liên hgia các thành phn trong cây cú pháp và tìm ra nhng qui lut để  
chuyn cây cú pháp đó vdng phù hp vi ngôn ngữ đích. Nói cách khác ta phi  
tìm mt cây cú pháp tương đương vi cây cú pháp ca ngôn ngngun.  
Ví d: Có câu tiếng Anh “I have read that interesting book.được phân tích  
cú pháp và các nghĩa ca ttrong câu đã được chn đúng như sau (tcó nghĩa ε  
tc là tchỉ đóng vai trò cú pháp, nó không có nghĩa thc s) :  
S
NP  
VP  
.
.
PRP  
AUX  
VP  
I/Tôi  
have/ε  
ADV  
VP  
already/ri  
NP  
V
read/đọc  
ADJP  
N
book/cun sách  
DT  
ADJ  
that/đó interesting/thú vị  
Hình 5: Cây cú pháp ca câu “I have already read that  
interesting book.”  
Trang 21  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
Nếu chỉ đơn thun là gn nghĩa thì câu tiếng Vit được phát sinh là “Tôi ri  
đọc đó thú vcun sách .”. Trong tiếng Vit, câu này hoàn toàn vô nghĩa vì trt tự  
các thành phn sai vtrí sdn đến trt ttsai và ta không biết được nghĩa chính  
xác ca câu là gì.  
Chương trình chuyn đổi cây cú pháp có nhim vthay đổi vtrí, chèn hoc  
xoá các thành phn trong cây cú pháp sao cho trt ttbmt ca câu trnên  
đúng. Trong ví dtrên, ta thy nếu chương trình chuyn đổi thay đổi cây cú pháp  
ca câu theo các lut sau :  
1.(ADJP (DT) (A))(ADJP (A) (DT)) : Nếu ngtính tbao gm mt chỉ định  
t(DT) đứng trước mt tính t(A) thì đảo trt t2 thành phn con đó.  
2.(NP (ADJP) (N)) (NP (N) (ADJP)) : Nếu ngdanh tbao gm mt ngữ  
tính t(ADJP) đứng trước danh t(N) thì đảo trt t2 thành phn con đó.  
3.(VP (AUX have) (VP)) (VP ε (VP)) : Nếu ngữ động tbao gm mt trợ  
động thave đứng trước mt ngữ động tkhác txoá trợ động từ đi.  
4.(VP (ADV already) (VP)) (VP (VP) (ADV already)) : Nếu ngữ động tbao  
gm trng talready đứng trước ngữ động tthì đảo trt t2 thành phn  
này.  
Æ câu tiếng Vit “Tôi đọc cun sách thú vị đó ri.” slà mt câu có nghĩa.  
1.3 Cơ slý thuyết  
Để chuyn đổi cây cú pháp, chúng ta phi có được :  
™ Kết quphân tích ngpháp ca mt câu tiếng Anh ra dng cây cú pháp và  
nhng thông tin cn thiết khác để xác định mi liên hgia các thành phn  
cây cú pháp. Nhưng chcn quan tâm đến nhng mi liên hnh hưởng  
đến vic chuyn đổi cu trúc cú pháp ca câu.  
™ Blut chuyn đổi tcây cú pháp tiếng Anh sang cây cú pháp tiếng Vit.  
Trang 22  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
1.3.1 Cơ slý thuyết ngôn nghc ca vic chuyn đổi  
“Yếu tnào gây ra skhác bit trong cu trúc câu gia hai ngôn ng?”, đó là  
câu hi đầu tiên đặt ra cho nhng người mun tự động hoá vic chuyn đổi cu trúc  
câu gia hai ngôn ng. Đây cũng là mt vn đề ln mà các nhà ngôn nghc so  
sánh phi gii quyết. Vi cp ngôn ngAnh - Vit, đã có nhiu công trình nghiên  
cu vvn đề này, tuy nhiên hu như chưa có công trình nào gii quyết trn vn vì  
ngay cngpháp tiếng Vit hin vn chưa được nghiên cu đầy đủ. Có người quan  
nim ngpháp tiếng Vit cũng ging như ngpháp tiếng Anh (quan nim “dĩ Âu vi  
trung”), li có ý kiến cho rng nên phân tích ngpháp câu tiếng Vit theo cu trúc  
Đề - Thuyết.  
Vì mc tiêu cui cùng ca chương trình chuyn đổi cây cú pháp là trt tcác  
ttrong câu phát sinh phi đúng, chúng em chn cách phân tích cú pháp câu tiếng  
Vit theo ngpháp to sinh ca Chomsky vi các nhãn cú pháp (thành tkết thúc  
và thành tkhông kết thúc) ging như ngpháp tiếng Anh để so sánh skhác bit  
cú pháp câu tiếng Vit và tiếng Anh nhm gim bt độ phc tp ca bài toán đặt ra,  
đồng thi sdng được nhiu kết quca ngành ngôn nghc so sánh.  
1.3.1.1 Ngpháp to sinh  
™ Ngpháp  
Để to thành mt câu có nghĩa trong mt ngôn ngnào đó, ta không thchỉ  
đơn gin kết hp các tbt ktheo thtngu nhiên, mà skết hp đó phi tuân  
thnhng lut ngpháp ca ngôn ngữ đó.  
Định nghĩa: Ngpháp G được định nghĩa là shp thành ca 4 thành phn  
G =  
(
N,Σ, P, S0  
™ N : tp hp các thành tkhông kết thúc (nonterminal) như NP, VP,...  
: tp hp các thành tkết thúc (terminal) như Adj, Noun,...  
)
, vi :  
™
™ P : Tp hp các lut ngpháp  
™ S0 : Ký hiu thành tkhi đầu câu  
Trang 23  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
Tp hp lut ngpháp bao gm 2 loi lut là lut tpháp và lut cú pháp.  
Lut tpháp đảm bo cho mi ttn ti trong câu đều có nghĩa riêng. Lut cú pháp  
quy định trt tkết hp các thành phn ngpháp để to thành mt câu hoàn chnh  
có nghĩa.  
™ Cây cú pháp  
Trong định nghĩa ngpháp trên ta thy mi câu đều bt đầu bng ký hiu S0  
được biu din bng mt chui phân cp ca các thành t. Cu trúc ngpháp ca  
mt câu có thrt phc tp, vì vy để biu din nó, người ta dùng cây cú pháp thể  
hin các mi quan hgia các thành phn trong lut ngpháp bng sơ đồ trc quan  
dng cây. Mi cây cú pháp có mt nút gc đóng vai trò là S0, mi nút lá tương ng  
vi mt t(thành tkết thúc).  
Định nghĩa: Cho G =  
(
N,Σ, P, S0  
là mt ngpháp phi ngcnh. S0 biu din  
)
nút gc hay nút khi đầu ca cây phân cp.  
1. Nếu S0X1 X2... Xn là mt lut ngpháp (P ) thì ta gn các nút X1,X2,  
..., Xn vào làm con ca nút gc theo thtttrái sang phi.  
2. Nếu có nút con Xi và các lut XiY1 Y2... Yn, thì ta sgn các nút Y1,Y2,  
..., Yn vào làm con trc tiếp ca nút Xi theo thtttrái sang phi.  
3. Tiếp tc như thế cho đến khi tp hp các nút con cui cùng đều là thành tố  
kết thúc (terminal) hoc là chui rng ε .  
Trong lun văn này, chúng em sdng bphân tích cú pháp tiếng Anh EGT  
(2001) cho kết quphân tích cú pháp có độ chính xác cao nht trên thế gii hin  
nay. Bnhãn cú pháp và nhãn tloi sdng là bnhãn ca Penn Tree Bank (phụ  
lc 5).  
1.3.1.2 Nhng khác bit trong cu trúc tiếng Vit so vi tiếng Anh  
Tiếng Anh và tiếng Vit cùng loi hình trt tS-V-O là loi hình phbiến thứ  
nhì sau loi hình S-O-V. Tuy nhiên, trt tttrong các ngcó mt số đim khác  
nhau, nht là thành phn định ngtrong danh ng. Đối vi tiếng Vit, trt ttvà  
thư là hai phương tin ngpháp chyếu. Theo quan đim ngôn nghc truyn  
Trang 24  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
thng: các nhân ttrt ttphthuc vào cu trúc ca đơn vngôn ngvà phụ  
thuc vào các mi quan hgia các thành t. Có nhân tbên ngoài và có nhân tố  
bên trong, chuyn đổi cu trúc chtp trung vào nhng nhân tbên ngoài chứ  
không quan tâm đến cu trúc ca t. Do đó vic kho sát trt tttrong các thành  
phn trong ngvà cao hơn là trt tcác thành phn trong câu slà cơ sở để xây  
dng cách thc khai thác ngun tri thc chuyn đổi cu trúc.  
1.3.1.2.1 Trong phm vi ngữ  
™
Ngdanh t: trt tcác thành phn bnghĩa cho danh tchính trong ngữ  
danh tcó nhiu đim khác bit so vi tiếng Anh. Vtrí ca thành phn bnghĩa so  
vi danh tchính phthuc vào loi chc năng bnghĩa ca nó. Định ngữ được  
chia thành 2 loi căn cvào vtrí ca nó so vi danh tchính: tin định ng(đứng  
trước) và hu định ng(đứng sau).  
™
Tin định ngtiếng Anh có thlà tính tmiêu t, danh t, động danh t, động  
tính t, phó t, danh tchshu cách, chỉ định t, tính tshu, st. Đối vi  
tiếng Vit, phn ln các tin định ngnày đứng sau danh tchính. Tuy nhiên cũng  
có mt strường hp ngoi l.  
Trang 25  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
Định nglà tính tmiêu t:  
a
big red fox  
-2 -1  
Định nglà danh t:  
mt con chn đỏ to ln  
+1 +2  
0
0
the weather forecast  
-1  
dbáo thi tiết  
0
0
+1  
Định nglà danh triêng :  
forest Nam Cat Tien  
rng  
Nam Cát Tiên  
+1  
0
-1  
0
Định ngđộng danh thay động tính t:  
freezing point  
-1  
Định nglà phó t:  
đim đông đặc  
+1  
0
0
the after years  
-1  
Định nglà chỉ định thay tính tshu:  
nhng năm sau đó  
0
0
+1  
that man  
-1  
her friend  
-1  
Định nglà số đếm:  
người đàn ông đó  
0
0
+1  
bn ca cô y  
0
0
+1  
One sister  
-1  
Định nglà stht:  
mt cô em gái  
-1  
0
0
The  
last  
-1  
Mohicans người Mohican cui cùng  
+1  
0
0
Hình 6: So sánh trt tự định ngtiếng Anh và tiếng Vit (0: vị  
trí danh tchính trong ng, -: tbnghĩa đứng trước danh từ  
chính, +: tbnghĩa đứng sau danh tchính)  
Trang 26  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
Dưới đây là bng tóm tt trt tphbiến ca các thành phn trong danh ngữ  
tiếng Anh và tiếng Vit. Trong danh ng, thành phn nào có vtrí nhhơn sẽ đứng  
trước.  
Vtrí  
1
Tloi  
Pre Determiner  
Determiner  
Ordinal Number  
Cardinal Number  
Size  
Ví dụ  
All  
2
Her, …Some,…  
First  
3
4
One, One hundred  
Small, big  
5
6
Quality  
Pretty, modern  
Old,new  
7
Age  
8
Shape, length  
Color  
Round, long  
Green, red  
9
10  
11  
12  
13  
14  
Nationality  
Vietnamese  
Present/ Past participle Printing, fried  
Sub Noun  
Head Noun  
Possessive Case  
’s  
Bng 1: Trt tcác thành phn trong ngdanh ttiếng  
Anh  
Vtrí  
Tloi  
Ttng lượng  
Ví dụ  
Tt cả  
1
2
3
4
5
6
Stừ  
Mt, hai  
Tchxut  
Danh tchính  
Danh tphụ  
Cái, con  
Tính tchtrng thái vt liu Thiếc  
Trang 27  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
7
Quc tch  
Vit, Hoa  
Nh, ln  
Tròn  
8
Kích thước  
Hình dng, chiu dài  
Tui tác  
9
10  
11  
12  
13  
14  
15  
Mi, cũ  
Đẹp, có ích  
Xanh, đỏ  
Mt, hai  
Đó, nọ  
Cht lượng  
Màu sc  
Sthtự  
Chỉ định t,  
Tính tchshu  
Ca cô ta  
Bng 2: Trt tcác thành phn trong ngdanh ttiếng Vit  
™ Hu định ngữ  
Không có skhác bit vtrt tca hu định ngso vi danh tchính  
trong tiếng Anh và tiếng Vit  
The girl with blond hair Cô gái có mái tóc vàng  
™ Ngữ động t, ngtính t: Phn ln có cu trúc ging nhau 2 ngôn ngữ  
1.3.1.2.2 Trong phm vi mnh đề  
mc mnh đề, chúng ta quan tâm đến trt tcác thành phn ngpháp như :  
cht, động tchính, trợ động t, túc ttrc tiếp, túc tgián tiếp, trng ng,... Mt  
cách đơn gin ta có thcoi mnh đề là mt câu đơn vì nó có các thành phn cht,  
động tchính.  
Tiếng Anh và tiếng Vit đều thuc loi hình ngôn ngS-V-O, nên nhìn chung  
trt tca nhánh trong cây cú pháp givai trò là mt quan hngpháp trong mnh  
có xu hướng không thay đổi nhiu. Theo kết qukho sát thì thành phn trng ngữ  
và thành phn hi trong câu hi tiếng Anh có trt tbthay đổi nhiu nht.  
™ Trng ngữ  
Trng ngchthi gian trong tiếng Anh thường nm cui câu, nhưng ngược  
li trong tiếng Vit chúng thường nm ở đầu câu. Trng ngchthcách, tn sut  
Trang 28  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
trong tiếng Anh có thxut hin ở đầu câu, sau chng, hoc cui câu tùy theo  
tng loi trng ng. Nói chung, đặc đim riêng ca tng ngôn ngvà thói quen sử  
dng ngôn ngữ đã hình thành nên nhng trt ttnhiên không tuân theo mt qui  
lut cthnào.  
Ví d:  
I have not done my exercises yet.  
-> Tôi chưa làm bài tp.  
™ Câu hi  
Phương tin ngpháp “trt tt” trong tiếng Anh thhin rõ nht qua các loi  
câu hi. Câu hi trong tiếng Anh được chia thành hai loi chính Yes/No và WH-  
question. Thành phn mun hi được đảo lên đầu câu và được thay thế bng thi  
tương ng. Chng hn khi mun hi “Con chó ca bn đã cn ai vy?”, ta dùng  
Whom did your dog bite ?”, thi whom cho biết ta đang mun hi túc tca  
động tchính trong câu và whom givtrí đầu câu.  
Trt tcác thành phn trong câu hi tiếng Vit không thay đổi so vi các loi  
câu khng định, phủ định. Nhưng trong đó, xut hin các từ được thêm vào như  
“không”, “phi không”,...  
1.3.1.2.3 Phm vi câu  
Thành phn được kho sát trt tlà các mnh đề. Hu hết mnh đề (chính hay  
ph) trong tiếng Anh đều ginguyên trt tkhi dch sang tiếng Vit. Điu này làm  
gim bt độ phc tp cho bài toán chuyn đổi trt tcác thành phn trong mt câu.  
1.3.1.2.4 Hư từ  
Tiếng Vit có 3 tp hp tcơ bn:  
™ Thc t: chiếm slượng ln nht trong vn t, mang ý nghĩa ngvng.  
Thc tcó thể đứng làm trung tâm các ng, tp hp chung quanh chúng là  
nhng thành tph. Thc tcó thgichc vngpháp trong câu, tc là  
làm thành phn câu (thành phn chính và ph), xa hơn na là thc tcó  
khnăng độc lp to câu.  
Trang 29  
Chương 1 - Tng quan vchuyn đổi cây cú pháp  
™ Ttính thái: có slượng nh, nhưng có đặc trưng riêng vbn cht ngữ  
pháp. Nó không có ý nghĩa tvng và cũng không có ý nghĩa ngpháp.  
Ttình thái din đạt mi quan hgia người nói vi thc ti, nhờ đó góp  
phn hình thành mc đích phát ngôn. Ttình thái không làm thành phn  
ca câu.  
™ Hư t: có slượng rt ít, có tính cht ngpháp, là phương tin biu đạt  
mi quan hgia các khái nim trong tư duy theo cách thc phn ánh bng  
ngôn ngca người bn ng. Hư tkhông làm trung tâm ca ng, chlàm  
thành tphnhưng cũng rt ít, đa scác trường hp, hư từ được dùng làm  
yếu tliên kết “xúc tác” ca các đơn vcu trúc ngpháp. Hư tkhông  
độc lp to câu và cũng không làm thành phn câu.  
Hư ttiếng Vit bao gm hai tp con: hư tlàm tphdin đạt các ý nghĩa  
ngpháp ca thc t, còn gi là hư ttpháp, hư tvi chc năng liên kết, còn gi  
là hư tcú pháp, bao gm cliên tvà gii t.  
Trong bài toán chuyn đổi cây cú pháp, ta phi quan tâm đến hư tvì nó có  
liên quan đến cu trúc ccác đơn vngpháp, đồng thi hư ttloi là tloi  
không có trong tiếng Anh, là nhng tmà máy tự động thêm vào để câu dch phát  
sinh có nghĩa rõ ràng và tnhiên hơn.  
Ví d:  
I am going to school.  
He ate a loaf of bread.  
Tôi đang đi hc.  
Anh ta đã ăn mt bánh mì.  
1.3.1.3 Các nhân tố ảnh hưởng  
Tnhng kết qunghiên cu ca ngành ngôn nghc so sánh, ta có thxác  
định được nhng nhân tnào nh hưởng đến skhác bit gia cu trúc tiếng Anh  
và tiếng Vit. Da trên cơ sở đó, chương trình chuyn đổi stự động rút ra các lut  
để chuyn đổi các thành phn trong cây cú pháp ca tiếng Anh cho phù hp vi  
tiếng Vit. Trt tcác thành phn cây cú pháp phthuc vào nhng nhân tsau :  
Trang 30  

Tải về để xem bản đầy đủ

pdf 159 trang yennguyen 28/06/2025 120
Bạn đang xem 30 trang mẫu của tài liệu "Luận văn Xây dựng chương trình chuyển đổi cây cú pháp trong hệ dịch tự động Anh - Việt", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfluan_van_xay_dung_chuong_trinh_chuyen_doi_cay_cu_phap_trong.pdf