Luận văn Tìm hiểu kỹ thuật dịch máy và ứng dụng vào tài liệu hàng không

BGIÁO DC VÀ ĐÀO TO  
TRƯỜNG ĐẠI HC BÁCH KHOA HÀ NI  
------------------------------------------  
LUN VĂN THC SĨ KHOA HC  
NGÀNH: CÔNG NGHTHÔNG TIN  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG  
VÀO TÀI LIU HÀNG KHÔNG  
TRN LÂM QUÂN  
Hà Ni  
2006  
NI 2006  
BGIÁO DC VÀ ĐÀO TO  
TRƯỜNG ĐẠI HC BÁCH KHOA HÀ NI  
------------------------------------------  
LUN VĂN THC SĨ KHOA HC  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG  
VÀO TÀI LIU HÀNG KHÔNG  
NGÀNH: CÔNG NGHTHÔNG TIN  
MÃ S:  
TRN LÂM QUÂN  
Người hướng dn khoa hc: TS. NGUYN KIM ANH  
NI 2006  
- 1 -  
Trn Lâm Quân  
LI CM ƠN  
Li đầu ca lun văn, em xin chân thành cm ơn Thy Cô trong khoa  
Công nghThông tin trường Đại hc Bách khoa Hà Ni đã tn tình chbo,  
truyn đạt kiến thc cho em trong sut hai năm qua.  
Xin biết ơn Cô Nguyn Kim Anh, người trc tiếp hướng dn em làm  
lun văn. Nếu không có shướng dn tn tình, truyn đạt kiến thc ca Cô  
thì lun văn này skhó hoàn thành.  
Cũng chân thành cám ơn gia đình, các bn trong lp, các cng tác viên  
đã động viên, sát cánh cùng tôi trong thi gian hc tp ti Trường, cũng như  
trong quá trình thc hin lun văn.  
Mc dù đã rt cgng, song chc chn lun văn không tránh khi  
nhng thiếu sót – mà có khi là khuyết đim. Em rt mong nhn được sthông  
cm và nhng ý kiến đóng góp tn tình ca các Thy Cô và các bn.  
Hà Ni, ngày 01 tháng 11 năm 2006  
Tác giả  
Trn Lâm Quân  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 2 -  
Trn Lâm Quân  
MC LC  
trang  
1
2
5
6
7
Li cm ơn  
Mc lc  
Danh mc các bng  
Danh mc các hình vẽ  
Li nói đầu  
Chương 1: Tng quan vdch máy  
I) Định nghĩa dch máy  
II) Vai trò ca dch máy  
III) Lch sdch máy  
11  
12  
13  
14  
14  
16  
17  
18  
19  
20  
1) Giai đon 1930 - 1940  
2) Giai đon 1940 - 1970  
3) Giai đon 1970 - 1990  
4) Giai đon 1990 - hin nay  
IV) Phân loi dch máy  
I) Phm vi ca lun văn  
VI) Kết chương  
Chương 2: Các phương pháp dch máy  
I) Vn đề ngôn ngtrong dch máy  
II) Kho ngliu  
21  
24  
25  
27  
27  
29  
III) Dch trc tiếp  
IV) Dch chuyn đổi  
1) Dch chuyn đổi cú pháp  
2) Dch chuyn đổi cú pháp + phân gii ngnghĩa  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 3 -  
Trn Lâm Quân  
30  
29  
3) Quy trình dch chuyn đổi  
V) Dch máy da trên thng kê (Statistical Machine  
Translation)  
32  
VI) Dch máy da trên mu ví d(Example-Based  
Machine Translation)  
33  
33  
33  
34  
35  
36  
38  
VII) Dch da trên cơ stri thc  
VIII) Dch da trên ngliu  
IX) Dch liên ngữ  
1) Ưu đim  
2) Nhược đim  
3) Phân hoch liên ngữ  
X) Kết chương  
Chương 3: Từ đin hàng không  
I) Kho sát  
39  
40  
1) Tp hp các từ đin Anh - Vit hàng không  
(dng sách)  
41  
2) Tp hp các từ đin Anh - Vit thông dng  
(dng phn mm)  
II) Biên tp để xây dng kho ngliu  
1) Nhp liu (t, nghĩa t, txem thêm)  
2) Phân nhóm từ  
42  
42  
43  
44  
3) Biên tp  
III) La chn mô hình, thiết kế gii thut, giao din và  
viết chương trình  
49  
60  
IV) Thiết kế và viết mã  
V) Xin ý kiến đóng góp ca các chuyên gia và người sử  
dng. Hoàn thin từ đin và thnghim dch máy  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 4 -  
Trn Lâm Quân  
62  
62  
VI) Tài liu sdng  
VII) Kết chương  
Chương 4: Cài đặt chương trình thnghim và đánh giá  
62  
63  
64  
I) Cách tiếp cn  
II) Bdliu thử  
III) Các yêu cu vphn cng, phn mm ca trình thử  
nghim  
65  
IV) Kết quthc nghim  
V) So sánh  
73  
75  
1) Vi EV-Trans 3.0  
2) Vi Lc Vit từ đin (chc năng tra ttự động  
- AutoLook)  
76  
78  
82  
Chương 5: Kết lun - Hướng phát trin  
Tài liu tham kho  
Tóm tt lun văn  
Phlc  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 5 -  
Trn Lâm Quân  
DANH MC CÁC BNG  
Trang  
Bng 2.1: Bng so sáng khái quát tiếng Anh - tiếng Vit  
Bng 3.1: Cu trúc dng bng ca kho ngliu  
24  
48  
66  
75  
76  
Bng 4.1: Ni dung mu thnghim  
Bng 4.2: So sánh vi EV-Trans 3.0  
Bng 4.3: So sánh vi Lc Vit từ đin 2002  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 6 -  
Trn Lâm Quân  
DANH MC CÁC HÌNH VẼ  
Trang  
11  
Hình 1.1: Quá trình xlý tài liu dch máy  
Hình 2.1: Sơ đồ mt hdch trc tiếp  
25  
Hình 2.2: Sơ đồ mt hdch chuyn đổi  
Hình 2.3: Sơ đồ mt hdch da trên mu ví dụ  
Hình 2.4: Tương quan gia 3 sơ đồ dch máy  
Hình 2.5: Mô hình hdch liên ngữ  
28  
32  
34  
35  
Hình 2.6: Cây phhngôn nghAustro-Asiatic  
Hình 2.7: Cây phhngôn nghIndo-European  
37  
38  
Hình 3.1: Mô hình chc năng Từ đin hàng không + Dch máy  
Hình 3.2: Giao din tra từ  
53  
54  
55  
55  
56  
57  
57  
58  
58  
84  
85  
Hình 3.3: Giao din sa từ  
Hình 3.4: Giao din thêm từ  
Hình 3.5: Giao din xóa từ  
Hình 3.6: Màn hình thut ngviết tt  
Hình 3.7: Cài đặt tùy chn  
Hình 3.8: Giao din từ đin riêng  
Hình 3.9: Cơ chế Hook  
(phlc) Giao din ca phn mm Từ đin hàng không + Dch máy  
(phlc) Giao din ca thnghim Dch máy + chc năng máy hc  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 7 -  
Trn Lâm Quân  
LI NÓI ĐẦU  
Chế to ra mt loi máy có khnăng dch tự động để giúp cho con  
người vượt qua rào cn ngôn nglà mt mơ ước ca loài người đã có tthế  
kXVII, rt lâu trước khi máy tính đin tra đời. Khi khoa hc công nghệ  
phát trin mnh, yêu cu nm bt thông tin vkthut nhanh và chính xác trở  
nên cn thiết. Đa scác tài liu kthut đều được viết bng tiếng Anh.  
Chng bao lâu sau khi máy tính đin tử đầu tiên ra đời, bên cnh nhng  
ng dng tính toán trong lĩnh vc toán hc và vt lý, con người nghĩ ngay đến  
vic sdng “não bca máy tính” cho nhng ng dng thc tin, trong đó  
có vn đề dch máy. Ln đầu tiên, vic sdng máy tính đin tử để dch văn  
bn tngôn ngnày sang ngôn ngkhác được đề cp đến trong nhng cuc  
tho lun gia Andrew D. Booth và Warren Weaver vào năm 1946. Vượt qua  
nhiu trngi vlý thuyết và công ngh, Booth đã cho ra mt “hdch da  
trên từ đin” đầu tiên ti hi nghca MIT vào năm 1952. [16] [17] [18].  
Trôi chy vi thi gian, trong sphát trin nhanh chóng ca mng máy  
tính và công nghtruyn thông, con người ngày càng có điu kin tiếp xúc  
vi ngun tri thc rt phong phú nhiu dng khác nhau (chviết, hình nh,  
âm thanh, .v.v.), được thhin nhiu ngôn ngkhác nhau. Nhu cu đọc hiu  
và trao đổi thông tin trnên cn thiết hơn bao gi, thế nhưng, nhu cu này đã  
gp phi mt rào cn - skhác bit vmt ngôn ng. Và, ngôn ng, tthân  
đã vn rt phc tp.  
Con người đã tìm cách vượt qua rào cn ngôn ngtheo nhiu cách khác  
nhau, tvic xây dng các btừ đin song ng, các nghiên cu vdch thut  
liên ng, phương pháp hc ngoi ngnhanh chóng, cho đến cvic to ra  
mt ngôn ngchung cho loài người - quc tế ngEsperanto. Vào thi đim  
sc mnh ca máy tính đã được khng định, bài toán sdng máy tính để  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 8 -  
Trn Lâm Quân  
chuyn đổi tri thc được viết bng ngôn ngnày sang mt ngôn ngkhác  
được đặt ra. Trong khong 50 năm, có rt nhiu phương pháp dch máy đã  
được gii thiu và trin khai. Hin nay, đã có nhiu hdch tự động được  
thương mi hóa dng các chương trình máy tính hoc các dch vweb.  
Snhìn nhn vvn đề dch máy (Machine Translation) đã nhiu ln  
thay đổi trong hơn năm mươi năm qua, tchhình dung rng dch thut là  
công vic đơn gin, máy sdch mi loi văn bn không kém gì con người,  
như mt bmáy vn năng, cho đến chkhng định rng dch máy tự động,  
cht lượng cao là hoàn toàn không khthi. Ngày hôm nay, hu hết các  
chuyên gia vdch máy đều có chung quan đim rng máy tính chcó thể  
biên dch văn bn cht lượng chp nhn được trong mt lĩnh vc chuyên môn  
hp, hoc chcó thhtrdch thô để đọc hiu. Phương pháp dch máy da  
hoàn toàn vào kho ngliu như Dch máy da trên Thng kê (Statistical  
Machine Translation) hay Dch máy da trên mu ví d(Example-based  
Machine Translation) được xem là chcó ích để dch vi cht lượng tương đối  
thp cho mi loi văn bn. [16] [17] [18]  
Nguyên nhân chính có ldo skhác bit ln gia hai thế gii: người  
và máy. Ngoài ra, không thkhông kể đến tính nhp nhng - vn là bn cht  
ca ngôn ngtnhiên.  
Ngôn ngtnhiên là mt thc thphc tp. Kết xut ca ng dng  
dch máy (câu đích) thường không din đạt được trôi chy như mt li nói,  
mt câu viết ca thế gii thc, hoc thơn, dưới mt hình thc phi lý, trái  
ngược hn vi trc cm ca con người.  
Đối vi tiếng Vit, vn đề xây dng mt hdch máy để tự động dch  
ttiếng Anh sang tiếng Vit đã được đặt ra tlâu. Điu kin tiên quyết trong  
vic xây dng mt chương trình dch là vic xây dng cơ stri thc vngôn  
ngcho hdch. Cht lượng dch phthuc vào vic cp nht dliu cho cơ  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 9 -  
Trn Lâm Quân  
stri thc, mà công vic này đòi hi đầu tư rt ln và thi gian thc hin  
công vic là lâu dài.  
Ngày hôm nay, chương trình được ng dng trên thc tế được biết  
đến nhiu nht là chương trình dch tự động Anh-Vit EVTran 3.0 ca TS. Lê  
Khánh Hùng, ngoài ra có mt scác chương trình khác nhưng mi chỉ đang  
được thnghim trong phm vi hp chchưa được đưa ra thtrường.  
Vi mong mun hc hi, chúng tôi mnh dn chn đề tài “Tìm hiu kỹ  
thut dch máy và ng dng vào tài liu hàng không” cho lun văn ca mình.  
Kết xut ca lun văn là mt thnghim dch tự động da trên vic rút trích  
các tri thc (ngnghĩa) tcác n phm từ đin hàng không đã có và áp dng  
kthut hc máy. Mc du kết xut này chưa ti ưu, nhưng trên mt min xác  
định (tài liu hàng không), trong quá trình xây dng cơ sdliu tri thc  
(da vào máy hc) có stham gia tphía người dùng cui (CB-CNV ngành  
hàng không, nm vng kiến thc căn bn hàng không), slà tin đề cho các  
nghiên cu vsau ca chúng tôi và có thgóp phn phc vcho cng đồng.  
Lun văn được trình bày trong 5 chương, khái quát như sau:  
Chương 1: Tng quan vdch máy  
Trình bày về định nghĩa, vai trò, phân loi và lch sca dch máy.  
Chương 2: Các phương pháp dch máy  
Khái quát căn bn lý thuyết vngôn nghc áp dng trong dch máy.  
Gii thiu tng quan vbài toán dch tự động và các phương pháp gii  
quyết bài toán này trong nhng năm qua. Trong đó cũng đã đưa ra mt  
số đánh giá về ưu đim và nhược đim ca các hướng tiếp cn.  
Chương 3: Từ đin hàng không  
Mt cách hình thc, có thví dliu trong từ đin như thành phn  
xương sng ca thnghim dch máy áp dng trên tài liu hàng không.  
Trong chương này, chúng tôi trình bày chi tiết vchc năng, cách thc  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 10 -  
Trn Lâm Quân  
hot động, các kthut được sdng cơ bn để to nên phn mm từ  
đin và mt thnghim dch tự động.  
Chương 4: Cài đặt chương trình thnghim và đánh giá  
Sau lý thuyết là thc nghim; vi mong mun áp dng kiến thc đã hc  
vào thc tế, chương 4 strình bày các kết quthu được tdliu thc.  
Do min xác định ca lun văn: “Tìm hiu kthut dch máy và ng  
dng vào tài liu hàng không”, nên các dliu này được trích xut các  
web site ngành hàng không (ICAO, Boeing và Airbus).  
Chương 5: Phn kết lun  
Tng kết các kết quả đạt được và nêu hướng phát trin ca lun văn.  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 11 -  
Trn Lâm Quân  
CHƯƠNG 1: TNG QUAN VDCH MÁY  
I) Định nghĩa dch máy  
Khái nim dch máy đã được nhiu tác gitrong lĩnh vc xlý ngôn  
ngtnhiên định nghĩa, tuy có mt vài đim khác bit nhưng, hu hết đều  
tương đương vi định nghĩa sau:  
Mt hdch máy (Machine Translation System) là mt hthng sử  
dng máy tính để chuyn đổi văn bn được viết trong ngôn ngtnhiên này  
thành bn dch tương đương trong ngôn ngkhác. [5] [6]  
Khái nim “biên dch”, hay “phiên dch” hay đơn gin, “dch”, thường  
không được định nghĩa cht ch. Chúng tôi chưa tìm thy ở đâu có định nghĩa  
toán hc ca khái nim này.  
Ngôn ngca văn bn cn dch còn gi là ngôn ngngun, ngôn ngữ  
ca bn dch được gi là ngôn ngữ đích. Sơ đồ sau thhin vtrí ca hdch  
máy trong tiến trình dch tài liu.  
Cơ stri thc  
Văn  
bn  
Văn bn  
được  
Kết quả  
dch máy  
Văn  
bn  
ngun  
phân tích  
đích  
Dch máy  
Dch máy  
Con người  
Hiu đính  
Hình 1.1: Quá trình xlý tài liu dch máy.  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 12 -  
Trn Lâm Quân  
Đầu vào ca mt hdch máy thường là mt văn bn viết trong ngôn  
ngngun, quá trinh dch có thchia thành hai giai đon, đầu tiên, văn bn  
được phân tích thành các thành phn, sau đó được dch thành văn bn dng  
ngôn ngữ đích. Kết qudch có thể được con người hiu đính để trthành bn  
dch tt. Như vy trong mt quá trình dch, con người có thtác động vào các  
bước xlý vi mc đích làm cho kết qudch tt hơn.  
II) Vai trò ca dch máy  
Xa xưa, con người đã có mơ ước vmt “thc th” giúp con người có  
thhiu mi thtiếng khác. Ngày nay, nhu cu trao đổi thông tin gia các  
quc gia, các nn văn hóa, gia mi con người, .v.v. càng làm cho vic dch  
trnên quan trng. Để gii quyết vn đề dch thut, mt đội ngũ nhng người  
phiên dch, dch giả được hình thành và duy trì - để chuyn các li nói, văn  
bn tngôn ngnày sang ngôn ngkhác. Công vic dch sdng con người  
là công vic có tính thcông, cht lượng cao nhưng năng sut thp và giá  
thành cao.  
Mi cách dch – cách dch dùng người dch và dch bng máy – đều có  
vai trò riêng ca nó. Dch máy đã chng tnó có hiu quso vi chi phí bra  
(rhơn đáng k) khi cn dch khi lượng ln và/hoc dch nhanh nhng tài  
liu chuyên môn (kthut), cũng như trong nhiu tình hung khác (có nhiu  
tlp đi lp li).  
Trái li, khi cn dch nhng văn bn không có nhiu tlp li và sử  
dng ngôn ngtinh vi và rt phc tp (ví dnhư văn hc và lut), và thm chí  
ckhi cn dch nhng văn bn vi nhng chủ đề đặc bit, thì vn không có gì  
có ththay thế được người dch [1].  
Dch máy cũng có thphc vvic tìm kiếm và dch nhng tchính  
hoc cung cp mt bn dch thô ca các bn tóm tt bn gc (đôi khi có thể  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 13 -  
Trn Lâm Quân  
gi là “nhng ý chính”). Nói chung, chỗ đứng ca dch máy là bước khi  
đầu ca quá trình dch, là mt phương tin để tiến ti mc đích chbn thân  
nó khó có thlà sn phm cui cùng. Dch vi strgiúp ca máy tính là  
mt tiến bln trong thi gian gn đây trong qua trình phi hp gia máy  
dch và người dch. Phn ln nhng người dch sdng các công ctham  
chiếu như từ đin và từ đin đồng nghĩa trên mng. Dch vi strgiúp ca  
máy tính còn tiến xa hơn, bng cách kết hp dùng phn mm có nhng khả  
năng ví dnhư tự động ghi và lưu li mt scu trúc ngpháp hoc cách sp  
xếp tnht định (công cnày đặc bit hu dng để đảm bo snht quán khi  
dch các thut ngchuyên môn) trong cngôn nggc và ngôn ngdch, và  
gi ý cho người dch khi hgp li nhng thay cu trúc ngpháp này trong  
văn bn [1].  
Tóm li, vi sphát trin mnh mca khoa hc công ngh, khi  
lượng thông tin trao đổi ca con người ngày càng nhiu. Trong nhiu trường  
hp có thcó, con người không cn đến cht lượng dch cao như sdng  
người phiên dch mà chcn có mt bn dch nháp có cht lượng không quá  
thp nhưng không phi chờ đợi lâu. Vi trường hp cthnày, mt hdch  
máy cht lượng bình thường đáp ng tt hơn mt người phiên dch gii. Do  
vy, nhu cu cn có các hdch máy là tt yếu. Nếu xây dng hdch máy  
thành công, đây slà công cgiúp con người tiếp cn vi kho tri thc viết  
bng các ngôn ngkhác.  
III) Lch sdch máy  
Ngành dch máy đã có quá trình phát trin trên 50 năm, tuy có nhng  
giai đon hu như không phát trin nhưng dch máy vn là mt trong nhng  
chuyên ngành phát trin ca khoa hc máy tính vi nhiu kết quvlý thuyết  
ng dng thc tế. Có thchia sphát trin ca ngành dch máy thành ba  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 14 -  
Trn Lâm Quân  
thi k, ktnăm 1949 vi nhng ý tưởng sơ khai vmt hdch máy cho  
đến hin nay (2006) vi sra đời ca nhiu trình dch máy tương đối hoàn  
thin, đã có ng dng vào cuc sng.  
1) Giai đon 1930 - 1940  
Mơ ước vvic có thhiu ngôn ngca dân tc khác ca con người  
đã có trt lâu, tthế k17 nhiu nhà nghiên cu đã có nhng nlc đầu  
tiên trong vic xây dng mt cách biu din chung cho tt ccác ngôn ng.  
Năm 1933, đã có hai phát minh được cp bng sáng chế liên quan đến vic  
xây dng các thiết bdch ngôn ng. George Artsrouni mt người Pháp gc  
Armenia đã thiết kế mt thiết blưu trcó thtìm kiếm nhanh chóng các cp  
t- gii nghĩa ca hai cp ngôn ngbt k. Cũng trong năm đó, mt người  
Nga tên là Petr Smirnov-Troyanskii đã thiết kế mt thiết bdch máy gm 3  
công đon: Phân tích câu ngun, chuyn đổi tngvà sinh câu đích. Thiết kế  
ca Troyanskii tuy chưa bao gitrthành hin thc nhưng nó là ý tưởng cơ  
bn cho nhiu loi máy dch được thiết kế sau này.  
2) Giai đon 1940 - 1970:  
Vào cui nhng năm 1940, khi máy tính đã được phát minh và ng  
dng thành công vào vic gii mt mã, nhiu người đã nghĩ đến khnăng ng  
dng máy tính vào vic phiên dch vi quan đim coi vic dch tmt ngôn  
ngbt ksang tiếng Anh tương tnhư vic gii mã mt văn bn tiếng Anh  
được viết bng mt loi mt mã nào đó. Khái nim dch máy (machine  
translation) được Warren Weaver đề ra vào năm 1949. Nhng chương trình  
dch tự động đầu tiên đơn gin chsdng phương pháp dch tsang từ  
(word-for-word translation) đã cho nhng kết qurt gii hn vì tngcó  
nghĩa khác nhau trong nhng ngcnh khác nhau. Năm 1954, công ty IBM  
và trường đại hc tng hp Georgetown hp tác xây dng mt chương trình  
dch tự động Nga-Anh nhưng kết qurt hn chế. Vi khnăng gii hn ca  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 15 -  
Trn Lâm Quân  
máy tính trong nhng năm 1950-1960 và vic nghiên cu lý thuyết xlý  
ngôn ngtnhiên còn chp chng, các kết quthu được trong lĩnh vc dch  
tự động thi knày không đạt được kết qukhquan.  
Trong báo cáo ca mình viết năm 1960, Bar-Hillel cho rng không có  
hthng dch tự động nào có thdch mt cách trn vn nếu nó không biết  
được kiến thc vthế gii xung quanh và thông tin vngcnh hin ti. Ví  
dmà Bar-Hillel đưa ra là câu tiếng Anh “The pen is in the box and the box is  
in the pen” và khng định không có hdch nào có thchda vào từ đin mà  
phân bit được nghĩa ca t“pen” thnht (có nghĩa là “cái bút”) và t“pen”  
thhai (có nghĩa là “cái cũi”).  
Năm 1966, ti M, Hi đồng Cvn Xlý Ngôn ngTự động  
(Automatic Language Processing Advisory Committee – ALPAC) đã son  
mt báo cáo nhn định rng không thxây dng mt hthng dch tự động có  
hiu qu. Lp lun rng: "... vic dch ngôn ngkhông nhng chcn nhng  
kiến thc vngôn ngmà còn phi nhng kiến thc ngoài ngôn ng(extra-  
linguistic)…". Sau báo cáo này, các chính phủ đã không còn trcp cho các  
chương trình nghiên cu vDch Máy na và các chương trình này cũng  
chm dt.  
Nên giai đon này còn được biết vi tên giai đon trước ALPAC  
(Automatic Language Processing Advisory Committee)  
Vic nghiên cu và phát trin dch máy bước vào mt thi kyên ng  
chvi mt vài hot động ca các cá nhân và tchc nhbên ngoài nước M.  
Tuy nhiên các đầu tư cho dch máy trong lĩnh vc quân svn được tiếp tc  
như hthng dch Nga-Anh ca không lc M(hMark II, phát trin tnăm  
1964).  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 16 -  
Trn Lâm Quân  
3) Giai đon 1970 -1990  
Giai đon phc hi ca dch máy. Vào đầu nhng năm 1970, sau mt  
sthành công trong nghiên cu vlý thuyết xlý ngôn ngtnhiên và sc  
mnh ca máy tính cũng tăng lên đáng k(vi sra đời ca mch tích hp),  
nhiu trung tâm nghiên cu bt đầu quay li đầu tư vào dch máy. Năm 1973,  
Yorick Wilks gii thiu mt hthng dch tự động Anh-Pháp cho kết qukhá  
tt (mt người chbiết tiếng Pháp có thể đọc và hiu được kết qudch không  
cn tham kho bn gc tiếng Anh). Để đạt được thành qunày, hthng ca  
Wilks đã sdng các tri thc có tính “khái nim” (concepts) trong vic dch  
thut. Ví d: T“drink” không đơn thun là động t“ung”, trong hthng  
ca Wilks, t“drink” gm nhng khái nim như động tcó tính hot động”  
(activity verb), “có liên hệ đến nhng cht lng”,... Nhng tri thc như vy  
giúp cho hthng ca Wilks biết được mi liên hgia các ttrong câu và từ  
đó xác định được nghĩa chính xác hơn, phù hp vi ngcnh hơn.  
Thành công ca Wilks là cht xúc tác cho vic phc hi li nhng nghiên  
cu vdch máy, mt loi các đề án dch tự động ca rt nhiu tchc và  
quc gia được trin khai, ví dnhư:  
Hai hthng ca Liên Xô cũ, đều được bt đầu năm 1976, đó là hệ  
thng AMPAR dch ttiếng Anh sang tiếng Nga và hthng NERPA  
dch ttiếng Đức sang tiếng Nga.  
Hthng TAUM-METEO (1977) ca đại hc Montréal – Canada  
chuyên dch tin tc khí tượng ttiếng Anh sang tiếng Pháp.  
Dán EUROTRA (1982) ca Cng Đồng Châu Âu vi mc đích dch  
tmt ngôn ngnày sang ngôn ngkhác trong khi, chương trình hỗ  
trcác thtiếng: Anh, Pháp, Đức, Ý, Hà Lan, Đan Mch và Hy Lp.  
Hthng METAL (1985) ca Linguistic Research Center, đại hc  
Texas, dch ttiếng Đức sang tiếng Anh.  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 17 -  
Trn Lâm Quân  
Chương trình máy tính thế h5 (The Fifth Generation) ca chính phủ  
Nht Bn, mt trong các mc tiêu ca chương trình này là mt hthng  
dch tự động xuôi ngược Anh-Nht, Nht-Anh.  
4) Giai đon 1990 - hin nay  
Đầu nhng năm 1990, vi sphát trin mnh mca Internet, nhu cu  
trao đổi thông tin bùng n, cng vi stích lũy kiến thc vmt ngôn ng,  
sc mnh ca máy tính tăng lên hàng ngày và nhiu thành tu mi vmt lý  
thuyết, vic phát trin các hthng dch tự động trnên rt cn thiết. Dch  
máy đã bước sang mt giai đon phát trin mi, đạt được nhiu thành tu  
đáng khích l. Các phương pháp dch tiên tiến áp dng các kthut khai phá  
tri thc tkho dliu, điu mà trước kia chưa ththc hin được do khnăng  
hn chế ca máy tính, đã thay đổi hoàn toàn các phương pháp dch truyn  
thng và đem li mt cht lượng mi cho các hthng dch. Ngày nay, cht  
lượng ca nhiu hthng dch đã mc chp nhn được và mt scác ng  
dng dch tự động đã đi vào cuc sng trong mt slĩnh vc hp. Theo ước  
tính ca John Hutchins, vào năm 2001, có khong 1000 phn mm dch tự  
động các ngôn ngữ được bán trên thtrường. Tiêu biu nht trong thi đim  
hin nay là các server dch tự động trên Internet; chng hn dch vBabel  
Fish: Dch t9 ngôn ngthông dng sang tiếng Anh (gm tiếng Trung, tiếng  
Nht, tiếng Hàn, tiếng Đức, tiếng Ý, tiếng Tây Ban Nha, tiếng Pháp, tiếng Bồ  
Đào Nha và tiếng Nga) hoc dch vWorldLingo: Dch tự động gia 11 ngôn  
ngkhác nhau (gm tiếng Anh, tiếng Trung, tiếng Nht, tiếng Hàn, tiếng  
Đức, tiếng Ý, tiếng Tây Ban Nha, tiếng Pháp, tiếng Bồ Đào Nha, tiếng Nga và  
tiếng Hy Lp), các server này cung cp dch vdch tng câu hoc cmt  
trang web mà người dùng yêu cu tngôn ngnày sang ngôn ngkhác, để  
làm được điu này tt nhiên tc độ ca các hthng dch phi rt cao và cht  
lượng dch cũng phi mc tương đối tt.  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 18 -  
Trn Lâm Quân  
Nhm ti thtrường vcông nghtri thc, nhiu tp đoàn Mvà  
Châu Âu đã đầu tư rt ln vào các dán vxlý ngôn ngtnhiên, nhn  
dng và mô phng. Tiêu biu có dán ca công ty Microsoft cng tác vi  
trường đại hc tng hp Stanford cho vic nhn dng chviết, nhn dng  
tiếng nói, dch tự động, tóm tt ni dung,... mi có mt vài ng dng trên máy  
cm tay PocketPC hoc tích hp vào bOffice. Được ng dng phbiến hơn  
có các kết quca các phòng thí nghim ca công ty IBM đã được ng dng  
vào các hthng lái xe thông minh, hthng đặt vé máy bay ni địa tự  
động,... Vphía Châu Âu, có các sn phm ca công ty Lernout & Hauspie  
(sau này là Mendez) vi các hnhn dng tiếng nói, mô phng tiếng nói, dch  
máy, .v.v. [16] [17] [18]  
Ti Vit Nam, ngoài chương trình dch tự động Anh-Vit EVTran 3.0  
ca tác giLê Khánh Hùng, còn có mt scác chương trình khác nhưng mi  
chỉ đang được thnghim trong phm vi hp chchưa được đưa ra thị  
trường. Các chương trình dch tự động được nghiên cu ti Vit Nam chyếu  
hướng vào vic dch tự động Anh-Vit do có sn khá nhiu kết qunghiên  
cu vtiếng Anh, dch ttiếng Anh sang ngôn ngkhác để có tháp dng  
vào chương trình. [2]  
IV) Phân loi dch máy  
Có nhiu quan đim phân loi dch máy khác nhau, chng hn: Phân loi  
theo mc đích hdch, phân loi theo kthut dch,.... Vi tiêu chí phân loi  
dch máy theo mc đích hdch, Hutchins và Somers chia các hdch máy  
thành ba loi:  
Máy trdch (Machine-Aided Human Translation): Là các hthng  
giúp con người dch, người dch là chính. Ví d: Bkim tra chính t,  
kim tra ngpháp, từ đin, .v.v.  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 19 -  
Trn Lâm Quân  
Máy dch có trgiúp ca người (Human-Aided Machine Translation):  
Là các hthng dch vi strgiúp ca con người, máy dch là chính,  
nhim vca con người là trgiúp máy để nâng cao cht lượng dch  
(chng hn chn cho máy chuyên ngành thích hp vi tài liu cn dch  
để máy có thcó nhng la chn nghĩa chính xác hơn), sau đó con  
người shiu đính để to được bn dch cui cùng có cht lượng cao.  
Máy dch hoàn toàn tự động (Fully-automated Machine Translation):  
Là các hthng dch hoàn toàn tự động, không hcó bàn tay con người  
tkhi bt đầu xlý cho đến khi ra bn dch. Hthng này cũng là mơ  
ước và là mc đích sau cùng ca nhng người xây dng hthng dch.  
Hin nay, các hthng dch hoàn toàn tự động đã có mt trong mt số  
lĩnh vc hp, khi mà cht lượng ca bn dch không phi là yêu cu  
quan trng nht. [5] [6]  
V) Phm vi ca lun văn  
Phm vi nghiên cu ca lun văn là tìm hiu vdch máy và dch tự  
động trong tài liu hàng không. Đây là mt chủ đề rng, là mt bài toán khó,  
vì vy, lun văn chưa kvng tìm ra phương pháp gii quyết trn vn vn đề  
này mà mi chlà bước đầu tìm hiu bn cht vn đề đề xut mt thử  
nghim cho kết qucth. Lun văn hướng ti vic ng dng mô hình xây  
dng được vào bài toán dch tự động Anh-Vit áp dng cho tài liu hàng  
không, bng cách xây dng thnghim mt trình dch máy tcác từ đin  
Anh-Vit hàng không hin có.  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 20 -  
Trn Lâm Quân  
VI) Kết chương  
ng dng thnghim nào – cũng cn da trên mt nn tng lý thuyết  
khoa hc và chc chn, trong chương 2, lun văn skho cu căn bn lý  
thuyết vdch máy, trong đó đặt trng tâm vào các phương pháp dch máy.  
Trong phm vi hiu biết hp ca mình, chúng tôi cũng scgng trình bày ưu  
nhược đim ca tng phương pháp.  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 21 -  
Trn Lâm Quân  
CHƯƠNG 2: CÁC PHƯƠNG PHÁP DCH MÁY  
Có nhiu quan đim phân loi các hdch máy khác nhau, thông dng nht  
là phân loi theo mc đích ca hdch (dch tự động hoàn toàn, dch bán tự  
động, trdch, từ đin,...) và phân loi theo hướng tiếp cn kthut. Phn sau  
đây sẽ đề cp đến phân loi hdch theo hướng tiếp cn kthut vì đây cũng  
là cơ sở để phát trin các nghiên cu ca lun văn.  
Có 3 chiến lược dch máy chyếu và các biến thể đi theo các cách tiếp cn  
khác nhau: da trên lut (rule-based), da trên cơ stri thc (knowledge-  
based), da trên thng kê (statistics-based), da vào kho ngliu (corpus-  
based), .v.v. Ba chiến lược chyếu đó là:  
Dch trc tiếp  
Dch da trên chuyn đổi  
Dch da trên ngôn ngtrung gian (liên ng)  
Các trin khai hthng dch trong thc tế không phi luôn luôn sdng  
chmt hướng tiếp cn, nhiu hthng kết hp các phương pháp tiếp cn  
khác nhau để đạt được kết qutt nht. Có nhiu hướng tiếp cn theo cp độ  
từ đơn gin đến phc tp, bao gm: dch trc tiếp, dch theo chuyn đổi cú  
pháp, chuyn đổi cú pháp + phân gii ngnghĩa, dch qua ngôn ngtrung  
gian, dch da trên lut, dch da trên thng kê, dch da trên cơ stri thc,  
dch da trên ngliu… Dưới đây chúng tôi skhái quát căn bn lý thuyết về  
ngôn nghc áp dng trong dch máy, cũng như mô tmt skhái nim,  
cách tiếp cn, và chiến lược áp dng trong dch máy:  
I) Vn đề ngôn ngtrong dch máy:  
Có thnói xlý ngôn ngtự động trên máy tính là mt trong nhng  
vn đề khó nht ca Công nghthông tin và Truyn thông. Cái khó nm chỗ  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 22 -  
Trn Lâm Quân  
làm sao cho máy được hiu ngôn ngcon người, tvic hiu nghĩa tng từ  
trong mi hoàn cnh cth, đến vic hiu nghĩa mt câu, ri hiu cvăn bn.  
Minh ha li bng thí dca Marvin Minsky (1992), mt cây đa cây đề ca  
ngành trí tunhân to (Artificial Intelligence): “Xét t“si dây” chng hn.  
Ngày nay không mt máy tính nào có thhiu nghĩa tnày như con người.  
Còn chúng ta ai cũng biết có thdùng si dây để kéo mt vt, nhưng không  
thể đẩy mt vt bng si dây này. Ta có thgói mt gói hàng hoc thdiu  
bng mt si dây, nhưng không thể ăn si dây. Trong vài phút, mt đứa trẻ  
nhcó thchra hàng trăm cách dùng hoc không dùng mt si dây, nhưng  
không máy tính nào có thlàm vic này.” [11]  
Tiếng Anh và tiếng Vit là ngôn ngca hai dân tc khác nhau, có nn  
văn hóa khác nhau. Nên, yếu tkhác nhau gia tiếng Anh và tiếng Vit là mt  
khó khăn trong vn đề xlý ngnghĩa. Có thnói, có nhng khái nim trong  
tiếng Anh có thsdng cho tt csvt vi cùng mt nghĩa nhưng trong  
tiếng Vit thì không phi như vy. Trong nhng ngcnh khác nhau, ý nghĩa  
ca mt tlà khác nhau. Ngcnh ở đây có thể được xem như là ni dung  
ca văn bn đang đề cp, ý nghĩa ca các câu trước hoc sau có liên quan đến  
nó trong đon văn, hoc các tcó liên quan vi nó trong câu.  
Ví dminh ha như: Nếu ta viết “An old driver drives the car” thì  
nghĩa ở đây ca an old driver là mt người tài xế già, và nếu ta viết “I  
installed that old driver into this computer” thì cm đó li mang nghĩa là trình  
điu khin cũ.  
Có nhng ngcnh rt khác như trong câu “I book two books from Mr.  
Book”, tBook cui cùng là tên riêng, không được dch mà phi ginguyên.  
Có nhng thành ngrt đặc bit như: “It is raining cats and dogs” (tri mưa  
tm tã), hay “to be or not to be” (câu nói ni tiếng ca Hamlet “sng hay là  
chết”) không trình dch máy nào có thdch nếu không quy chiếu từ đin.  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 23 -  
Trn Lâm Quân  
Nhưng cũng có nhng thành ngnhư “keep an eye on something” (để mt  
vào), trình dch có thhoàn toàn hiu được nếu gn nghĩa theo cách thông  
thường và ghép ni li.  
Tham chiếu sang tiếng Vit, chúng ta cũng gp snhp nhng ca ngôn  
ngdưới mt góc độ khác, nêu ví dsau: Ông già đi nhanh quá”  
Chúng ta có 3 cách hiu:  
Cách 1: “Ông già” | “đi” | “nhanh” | “quá”  
Cách 2: “Ông” | “gđi” | “nhanh” | “quá”  
Cách 3: Ông già đã chết (khut) mt cách đột ngt. (nghĩa bóng)  
Đặc đim ca Tiếng Vit  
Đặc đim ca Tiếng Anh  
Được xếp là loi hình đơn lp Được xếp là loi hình hòa kết  
(isolate) hay còn gi là loi hình phi (flexion)  
hình thái.  
Trong hot động ngôn ng, tkhông Tcó biến đổi hình thái, ý nghĩa  
biến đổi hình thái, ý nghĩa ngpháp  
ngpháp nm trong t.  
nm ngoài t.  
Ví d: I see him và He sees me  
Ví d: Chngã em nâng và Em ngã  
chnâng  
Phương thc ngpháp chyếu là Phương thc ngpháp chyếu  
trt ttvà hư t.  
là pht(affix).  
Ví d: Go xay và Xay go; đang  
Ví d: studying và studied  
hc và hc ri ; “nó bo sao  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 24 -  
Trn Lâm Quân  
không ti”, “sao không bo nó  
ti”, “sao không ti bo nó” .v.v.  
Ranh gii tkhông được xác định Ranh gii từ được xác định bng  
mc nhiên bng khong trng. khong trng hoc du câu.  
Tn ti loi từ đặc bit “ tchloi” Hin tượng cu to bng tghép  
(classifier) hay còn gi là phó danh  
thêm pht(affix) vào gc tlà rt  
tchloi kèm theo vi danh t,  
phbiến. Trong khi hin tượng này  
như: cái bàn, cun sách, bc thư,  
không có trong tiếng Vit. Ví d:  
con chó, con sông, vì sao .v.v.  
anticomputerizational ( anticompute-  
Có hin tượng láy và nói lái trong  
er-ize-ation-al)  
tiếng Vit. Ví d: lp lánh, lung linh,  
.v.v.  
Bng 2.1: Bng so sáng khái quát tiếng Anh - tiếng Vit.  
[13]  
II) Kho ngliu  
Ngliu là các ngun dliu được sdng cho các bài toán trong lĩnh  
vc xlý ngôn ngtnhiên. Ngliu thường là tp hp các câu dưới dng  
tiếng nói hay văn bn, trong đó có cha các thông tin cn thiết cho tng bài  
toán cthtrong xlý ngôn ngtnhiên. Các thông tin này được trích chn  
sao cho phù hp vi các yêu cu ca bài toán.  
Các ngliu trong đó không cha các thông tin vngôn ngữ được gi  
là ngliu thô (hay ngliu trng). Vic thêm thông tin vào ngliu thô  
thường được làm bng tay, đôi khi có shtrnht định ca phn mm. Có  
thxem ngliu như mt cơ stri thc thô, trong đó, thông tin được thêm  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 25 -  
Trn Lâm Quân  
vào để chun bcho vic trích chn tri thc vsau được ddàng hơn. Vi  
ngun ngliu càng ln thì vic trích chn các tri thc vngôn ngcàng  
chính xác và đầy đủ hơn. Để trích chn thông tin vngôn ngtrên các ngun  
ngliu chúng ta thường dùng các gii thut hc. Các gii thut hc có thsử  
dng thông tin trong các ngliu để rút ra (mt cách tự động hay bán tự  
động) tp các lut cn thiết cho xlý ngôn ngtnhiên. Tp các lut này  
chính là cơ stri thc. Để trích chn các tri thc vngôn ngmt cách chính  
xác, chúng ta cn có các ngliu chính xác, các ngliu như thế được gi là  
ngliu vàng (golden corpus).  
III) Dch trc tiếp  
Tiếp cn dch trc tiếp được áp dng vào các chương trình dch tsm  
nht so vi các hướng tiếp cn khác, đây là hướng tiếp cn được sdng và  
phát trin khá thành công trong hthng dch Mark II (1964). Dch trc tiếp  
là phương pháp phát trin cho cp ngôn ngcth, tiến trình dch là mt quá  
trình biến đổi tngôn ngngun sang ngôn ngữ đích da trên từ đin song  
ngvà mt squy tc tvng kết hp vi mt squy tc xlý ngpháp đơn  
gin. Sơ đồ hdch trc tiếp được thhin mô hình dưới đây:  
Từ đin song ngữ  
Hình thái  
& ngữ  
nghĩa  
Hình thái  
& nghĩa  
thích hp  
nht  
Ngôn  
ngữ  
ngun  
Ngôn  
ngữ  
đích  
Hinh 2.1: Sơ đồ mt hdch trc tiếp.  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 26 -  
Trn Lâm Quân  
Dch trc tiếp sthc hin dch ngôn ngbng cách thay thế nhng từ  
trong ngôn ngngun vi nhng ttrong ngôn ngữ đích mt cách máy móc.  
Dch trc tiếp không phthuc nhiu vào các quan hngpháp và ngcnh.  
Dch trc tiếp phù hp cho nhng ng dng nơi mà văn bn dch có khi  
lượng tnh, nghĩa tđơn trvà slượng câu không ln. Các hdch trc  
tiếp hot động tương đối tt khi phiên dch các tài liu kthut.  
Dch trc tiếp da vào từ đin song ngmt cách trit để, cách thc  
thc hin dch trc tiếp đơn gin như tên gi ca nó. Vì tính đơn gin này, có  
thnói, dch trc tiếp không hình thành nên mt nn tng lý thuyết đi kèm,  
không có phương pháp lun. Nên cũng có nhà nghiên cu gi thut ngdch  
trc tiếp là dch nh. Nói cách khác, dch trc tiếp cháp dng được trong  
nhng min xác định hp (chuyên ngành).  
Mt hdch trc tiếp hot động theo 3 giai đon:  
ƒ Tin xlý: Ngt đon cn dch thành dãy các câu.  
ƒ Xlý: Hphân tích câu cn dch thành dãy các t, sau đó da trên từ đin  
song ng, tìm hình thái và nghĩa cho tng thay cm t.  
ƒ Sinh câu đích thích hp.  
Các hdch trc tiếp có ưu đim là đơn gin và có tc độ nhanh. Phương  
pháp rt thích hp vi vic dch trong nhng lĩnh vc chuyên môn (không có  
nhiu nhp nhng vngnghĩa) và cho kết qukhá tt khi áp dng cho các  
cp ngôn ngcó nhiu đim tương đồng vngpháp và tvng (như tiếng  
Pháp và tiếng Anh,...). Vi nhng cp ngôn ngít tương đồng hơn, hoc vi  
ngun có không gian nghĩa m(như các tác phm văn hc), cách tiếp cn này  
tra thiếu hiu qu.  
Biến thca dch trc tiếp, áp dng cho các chuyên ngành hp, đi theo  
hướng phrase-based (đơn vị được dch là mt chui các tliên tiếp) chứ  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  
- 27 -  
Trn Lâm Quân  
không phi là word-based (đơn vị để dch là t, word-for-word) là mt  
phương pháp mi, hiu quhơn trong xu hướng dch trc tiếp.  
IV) Dch chuyn đổi  
1) Dch chuyn đổi cú pháp  
Cũng có tài liu gi vn tt thut ngnày là dch chuyn đổi. Dch chuyn  
đổi cú pháp thc hin phân tích cú pháp câu được nhp vào và sau đó áp dng  
nhng lut ngôn ngvà tvng (hay còn được gi là nhng lut chuyn đổi)  
để ánh xthông tin văn phm tngôn ngnày sang ngôn ngkhác. Do đó,  
không thgii quyết các trường hp nhp nhng ngnghĩa ca câu có cùng  
cu trúc nhưng khác nghĩa nhau.  
So vi dch trc tiếp, các hthng dch chuyn đổi đi xa hơn các hdch  
trc tiếp trong vic phân tích ngpháp (và ngnghĩa) ca ngôn ngngun và  
ngôn ngữ đích. Đầu tiên, hdch chuyn đổi tiến hành phân tích ngpháp  
trong ngôn ngngun, sau đó cgng chuyn đổi sáng cu trúc ngpháp  
tương đương ngôn ngữ đích và cui cùng sinh câu đích tcu trúc ngpháp  
đã chuyn đổi. Sơ đồ hot động ca hdch chuyn đổi được thhin mô  
hình dưới đây:  
TÌM HIU KTHUT DCH MÁY VÀ NG DNG VÀO TÀI LIU HÀNG KHÔNG  

Tải về để xem bản đầy đủ

pdf 86 trang yennguyen 28/04/2025 120
Bạn đang xem 30 trang mẫu của tài liệu "Luận văn Tìm hiểu kỹ thuật dịch máy và ứng dụng vào tài liệu hàng không", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfluan_van_tim_hieu_ky_thuat_dich_may_va_ung_dung_vao_tai_lieu.pdf