Luận văn Ứng dụng mô hình nơron - mờ trong việc phát hiện tế bào cổ tử cung giai đoạn tiền ung thư
Luận văn  
					ứng dụng mô hình nơron -  
					mờ trong việc phát hiện tế  
					bào cổ tử cung giai đoạn  
					tiền ung thư  
				LỜI CẢM ƠN  
					Đầu tiên, em xin chân thành cám ơn Ban giám hiệu, các thầy cô trường Đại học  
					Khoa Học Tự Nhiên cùng các thầy cô Khoa Công Nghệ Thông Tin đã tận tình truyền  
					đạt những kiến thức quí báu cho chúng em trong suốt bốn năm học qua.  
					Tiếp đến, em xin gởi lời cám ơn chân thành nhất đến Tiến sĩ Lê Hoài Bắc. Thầy  
					đã cho em một định hướng đúng đắn cho đề tài của mình và luôn tận tình theo dõi quá  
					trình thực hiện đề tài cũng như giúp đỡ kịp thời khi cần thiết.  
					Em cũng xin chân thành cám ơn bác sĩ Trần Hòa, trưởng khoa Giải phẫu bệnh  
					(Bệnh viện C, Đà Nẵng) và Thạc sĩ Bác sĩ Nguyễn Thị Tuyết Mai (Bệnh viện Đa khoa,  
					Đà Nẵng) đã tận tình chỉ dẫn những kiến thức chuyên ngành cần thiết và tạo điều kiện  
					cho em tiếp cận thực tế.  
					Cuối cùng, em xin gởi tất cả tình cảm thân thương nhất đến gia đình, thầy cô và  
					bạn bè; những người luôn ủng hộ em về mọi mặt.  
					TP. Hồ Chí Minh, ngày 1 tháng 7 năm 2004  
					Võ Thị Thuỷ Tú  
					Trang 1  
				LỜI NÓI ĐẦU  
					Ung thư là một nhóm các bệnh gồm hơn 100 căn bệnh khác nhau, trong đó các  
					bệnh này đều ảnh hưởng đến đơn vị cơ bản nhất của cơ thể sống, đó là tế bào. Ung thư  
					xuất hiện khi việc phân chia tế bào trở nên bất thường, không thể kiểm soát được từ đó  
					sẽ dẫn đến tử vong nhanh chóng. Tại hội thảo quốc tế “Ung thư phụ nữ và trẻ em” tổ  
					chức tại Hà Nội ngày 6 và 7 tháng 11 năm 2003, qua thống kê, mỗi năm Việt Nam có  
					100000 đến 150000 người mắc bệnh ung thư được phát hiện, trong đó số người tử  
					vong lên đến 70000 người. Các nghiên cứu đã chứng minh rằng nhiều loại bệnh ung  
					thư có thể ngăn chặn nếu được phát hiện và điều trị sớm, chẳng hạn như ung thư vú,  
					ung thư cổ tử cung, ung thư da, ung thư tuyến tiền liệt,… Khi các bệnh này được phát  
					hiện sớm và điều trị thích hợp, 95% bệnh nhân có thể sống thêm ít nhất 5 năm.  
					Ung thư cổ tử cung là loại ung thư phụ khoa nguy hiểm thứ hai sau ung thư vú,  
					chiếm khoảng 18% các trường hợp ung thư ở hệ cơ quan sinh dục nữ. Bệnh là nguyên  
					nhân gây tử vong do ung thư cao nhất cho phụ nữ ở các nước đang phát triển. Đó là do  
					những nước này chưa thực hiện chương trình khám sàng lọc nhằm phát hiện sớm ung  
					thư. Việc chẩn đoán và điều trị cho từng bệnh nhân bị chi phối bởi tiến triển bệnh tại  
					thời điểm chẩn đoán. Quá trình điều trị sẽ trở nên đơn giản, hiệu quả, với chi phí thấp  
					nếu bệnh được phát hiện trong giai đoạn tiền ung thư, ngược lại nếu không điều trị kịp  
					thời thì bệnh sẽ không chữa được. Vì vậy, phát hiện sớm ung thư cổ tử cung rất quan  
					trọng, liên quan đến lợi ích người bệnh và hiệu quả điều trị. Để làm được điều này, các  
					bác sĩ giải phẫu bệnh sẽ khám sàng lọc cho tất cả các bệnh nhân ở độ tuổi có thể mắc  
					bệnh.  
					Năm 1943, bác sĩ George Papanicolaou đã giới thiệu một phương pháp đơn  
					giản, hiệu quả, thích hợp cho việc chẩn đoán tế bào cổ tử cung trong giai đoạn tiền ung  
					thư; đó chính là xét nghiệm Pap. Xét nghiệm này thỉnh thoảng vẫn cho kết quả không  
					chính xác do nhiều nguyên nhân khách quan và chủ quan. Nhiều phụ nữ sau khi được  
					Trang 2  
				khám sàng lọc vẫn chết do bệnh này. Một trong những nguyên nhân chính là do các tế  
					bào ung thư phát triển rất phức tạp, nên tỷ lệ chẩn đoán âm tính giả và dương tính giả  
					rất cao. Tỷ lệ chẩn đoán sai có thể giảm xuống bằng cách kiểm tra lại toàn bộ các mẫu  
					đã khám sàng lọc. Giải pháp này không khả thi vì tốn nhiều thời gian và công sức mà  
					hiệu quả lại không cao. Do đó, một hệ thống nhận dạng tự động tế bào tiền ung thư là  
					rất cần thiết và rất hữu ích.  
					Bên cạnh đó, việc xác định các hệ thống tự động đang là một công cụ ứng dụng  
					rất quan trọng trong nhiều lĩnh vực của xã hội. Trong đó, mô hình nơron – mờ dần dần  
					được thiết lập không chỉ trong lĩnh vực nghiên cứu mà còn trong lĩnh vực ứng dụng. Cả  
					mạng nơron và hệ thống mờ đều được phát triển dựa trên qui trình lập luận của con  
					người. Ở hệ thống mờ, các mối liên hệ được mô tả rõ ràng bằng các luật nếu – thì  
					nhưng lại thiếu khả năng tự điều chỉnh (khả năng “học”). Còn ở mạng nơron, các mối  
					liên hệ thể hiện không rõ ràng mà chỉ có thể thiết lập được những mô hình liên quan  
					nhân quả, tuy nhiên dữ liệu lại được mã hóa vào mạng thành các tham số có khả năng  
					“học”. Như vậy, các hệ thống tích hợp mạng nơron và logic mờ sẽ kết hợp được khả  
					năng ngữ nghĩa của hệ thống mờ và khả năng “học” của mạng nơron để tạo ra được  
					một mô hình suy luận hiệu quả nhất.  
					Với tính chất phức tạp của hệ thống phân lớp tế bào cổ tử cung, một hệ thống  
					nơron - mờ có thể khắc phục được một số lỗi thường gặp trong chẩn đoán, mà bác sĩ  
					hay mắc phải. Mô hình nơron – mờ kiểu ANFIS (hệ suy luận mờ loại Sugeno dựa trên  
					mạng thích nghi) được dùng để thực hiện phân lớp tế bào là bình thường hay bất  
					thường.  
					Báo cáo sẽ gồm 5 phần chính và 3 phần phụ:  
					• Chương 1: Tổng quan  
					Giới thiệu sơ lược về đề tài và các kiến thức cơ bản liên quan đến đề tài.  
					Trang 3  
				• Chương 2: Hệ thống suy luận mờ dựa trên mạng thích nghi  
					Trình bày về lý thuyết mô hình ANFIS: cấu trúc ANFIS và thuật toán học.  
					• Chương 3: Trích chọn đặc trưng  
					Nêu phương pháp tạo dữ liệu cho hệ thống phân loại tế bào và cách tính các đặc  
					trưng được trích ra từ ảnh tế bào.  
					• Chương 4: Phân lớp tế bào cổ tử cung sử dụng mô hình ANFIS  
					Mô tả cách thức mà mô hình ANFIS thực hiện phân lớp tế bào cổ tử cung trên  
					một số hệ thống luật mờ: luật chuyên gia, luật chuyên gia biến đổi và luật trích  
					dẫn từ hệ thống.  
					• Chương 5: Tổng kết  
					Giới thiệu chương trình và đánh giá mức độ thực hiện của hệ thống, cũng như  
					một số ưu, khuyết điểm và định hướng.  
					Trang 4  
				MỤC LỤC  
					LỜI CẢM ƠN.................................................................................................................1  
					LỜI NÓI ĐẦU ................................................................................................................2  
					MỤC LỤC.......................................................................................................................5  
					DANH MỤC HÌNH ẢNH..............................................................................................6  
					DANH MỤC BẢNG BIỂU............................................................................................7  
					BẢNG KÝ HIỆU CÁC CHỮ VIẾT TẮT....................................................................8  
					Chương 1: TỔNG QUAN..............................................................................................9  
					1.1. Giới thiệu sơ lược đề tài........................................................................................9  
					1.2. Mục đích của đề tài .............................................................................................10  
					1.3. Mẫu xét nghiệm Pap............................................................................................11  
					1.4. Một số nguyên nhân dẫn đến chẩn đoán sai........................................................16  
					1.5. Một số hệ thống phân lớp tế bào tự động và bán tự động...................................17  
					1.6. Phát biểu vấn đề ..................................................................................................19  
					1.7. Các tiêu chuẩn đánh giá mức độ thực hiện hệ thống ..........................................20  
					Chương 2: HỆ SUY LUẬN MỜ DỰA TRÊN MẠNG THÍCH NGHI ...................22  
					2.1. Giới thiệu sơ lược về mô hình nơron - mờ..........................................................22  
					2.2. Hệ thống suy luận mờ .........................................................................................23  
					2.3. Mạng thích nghi ..................................................................................................27  
					2.4. Hệ thống suy luận mờ dựa trên mạng thích nghi................................................33  
					Chương 3: TRÍCH CHỌN ĐẶC TRƯNG.................................................................37  
					3.1. Giới thiệu sơ lược về trích đặc trưng ..................................................................37  
					3.2. Dữ liệu nhập của hệ thống ..................................................................................37  
					3.3. Dữ liệu xuất của hệ thống ...................................................................................39  
					3.4. Trích chọn đặc trưng ...........................................................................................40  
					3.5. Các đặc trưng rút trích.........................................................................................46  
					Chương 4: PHÂN LOẠI TẾ BÀO CỔ TỬ CUNG SỬ DỤNG MÔ HÌNH ANFIS48  
					4.1. Cấu trúc ANFIS trong phân loại tế bào cổ tử cung.............................................48  
					4.2. Các hệ thống luật mờ trong phân loại tế bào ......................................................54  
					Chương 5: TỔNG KẾT ...............................................................................................59  
					5.1. Chương trình .......................................................................................................59  
					5.2. Mức độ thực hiện chương trình...........................................................................66  
					5.3. Đánh giá đề tài ....................................................................................................75  
					5.4. Hướng phát triển cho đề tài.................................................................................75  
					PHỤ LỤC......................................................................................................................76  
					PHỤ LỤC A: MỘT SỐ KIẾN THỨC Y KHOA CƠ BẢN ......................................76  
					PHỤ LỤC B: PHÂN ĐOẠN ẢNH............................................................................80  
					PHỤ LỤC C: PHƯƠNG PHÁP LỌC KALMAN .....................................................82  
					TÀI LIỆU THAM KHẢO ...........................................................................................84  
					Trang 5  
				DANH MỤC HÌNH ẢNH  
					Hình 1-1: Cấu trúc mô tế bào ở cổ tử cung....................................................................12  
					Hình 1-2: Phân lớp trong mô tế bào gai.........................................................................13  
					Hình 1-3: (a) tế bào gai cận đáy, (b) tế bào gai trung gian, (c) tế bào gai bề mặt, ........14  
					Hình 1-4: Phân lớp trong mô tế bào trụ .........................................................................14  
					Hình 1-5: Sơ đồ các bước thực hiện chẩn đoán .............................................................19  
					Hình 2-1: Hệ thống suy luận mờ....................................................................................25  
					Hình 2-2: Các luật mờ và các hệ thống suy luận ...........................................................27  
					Hình 2-3: Mạng thích nghi.............................................................................................27  
					Hình 2-4: (a) Suy luận mờ loại 3, (b) cấu trúc ANFIS tương ứng.................................34  
					Hình 3-1: Ảnh đã phân đoạn..........................................................................................40  
					Hình 3-2: Ảnh đã gán nhãn............................................................................................40  
					Hình 3-3: Các phép tính diện tích ..................................................................................41  
					Hình 3-4: Vị trí đường kính nhỏ nhất và lớn nhất .........................................................42  
					Hình 3-5: Tâm của trọng lực đối với nhân và bào tương...............................................44  
					Hình 3-6: Đường tròn cực tiểu cho nhân .......................................................................46  
					Hình 4-1: Ý nghĩa các tham số trong hàm dạng chuông................................................49  
					Hình 4-2: Cấu trúc ANFIS với 2 dữ liệu vào và 4 luật..................................................50  
					Trang 6  
				DANH MỤC BẢNG BIỂU  
					Bảng 1-1: Thống kê kích thước tế bào...........................................................................16  
					Bảng 2-1: Hai quá trình trong thuật toán học lai............................................................36  
					Bảng 3-1 : Danh sách các đặc trưng trích chọn vào cơ sở dữ liệu.................................47  
					Bảng 4-1: Ví dụ luật mờ phân loại tế bào ......................................................................48  
					Bảng 4-2: Luật chuyên gia.............................................................................................54  
					Bảng 4-3: Luật chuyên gia biến đổi...............................................................................55  
					Bảng 5-1: Luật chuyên gia số hóa..................................................................................66  
					Bảng 5-2: Mức độ thực hiện luật chuyên gia.................................................................67  
					Bảng 5-3: Mức độ kiểm nghiệm của luật chuyên gia ....................................................67  
					Bảng 5-4: Luật chuyên gia biến đổi số hóa....................................................................68  
					Bảng 5-5: Mức độ thực hiện luật chuyển gia biến đổi...................................................68  
					Bảng 5-6: Mức độ kiểm nghiệm của luật chuyên gia biến đổi ......................................69  
					Bảng 5-7: Luật trích từ hệ thống với 2 dữ liệu xuất.......................................................70  
					Bảng 5-8: Luật trích từ hệ thống với 7 dữ liệu xuất.......................................................72  
					Bảng 5-9: Mức độ thực hiện mạng của luật trích từ hệ thống .......................................72  
					Bảng 5-10: Mức độ kiểm nghiệm của luật trích từ hệ thống .........................................73  
					Trang 7  
				BẢNG KÝ HIỆU CÁC CHỮ VIẾT TẮT  
					ANFIS  
					RMSE  
					FN  
					Adaptive – Network – Based Fuzzy Inference System  
					Root Mean Square Error  
					False Negative  
					FP  
					False Positive  
					PP  
					Positive Predictive  
					NP  
					Negative Predictive  
					LSE  
					FDA  
					Least squares estimate  
					the Food and Drug Administration  
					Trang 8  
				Chương 1: TỔNG QUAN  
					Để có thể hiểu rõ về đề tài này, chương đầu tiên xin được trình bày về một số  
					kiến thức cơ bản liên quan đến ung thư cổ tử cung và một số công việc đã thực hiện  
					được trong lĩnh vực khám sàng lọc tự động. Tất cả những thông tin này phần nào nói  
					lên được những khó khăn, những tồn tại của các hệ thống chẩn đoán tự động, bán tự  
					động hoặc thủ công (do bác sĩ thực hiện), để từ đó nêu bật được sự cần thiết phải xuất  
					hiện một hệ thống mới.  
					1.1.Giới thiệu sơ lược đề tài  
					Ung thư cổ tử cung là loại bệnh nguy hiểm, chiếm tỉ lệ cao thứ hai sau ung thư  
					vú. Ở Úc, hơn một nghìn trường hợp ung thư cổ tử cung được chẩn đoán hằng năm, và  
					khoảng 350 phụ nữ chết vì bệnh này (Viện Sức khoẻ Úc, 1991). Độ tuổi trung bình  
					người bệnh là 52,2 và thường tập trung vào hai độ tuổi 35-39 và 60-64. Thống kê tại  
					Mĩ cho thấy, ở phụ nữ da trắng, 54% bệnh nhân ung thư cổ tử cung khi được chẩn đoán  
					bệnh còn ở giai đoạn khu trú (tiền ung thư), 31% có tổn thương trong vùng (ung thư)  
					và 8% có di căn xa (ung thư giai đoạn cuối); ở phụ nữ Mỹ gốc Phi, tỉ lệ này tương ứng  
					là 40%, 40% và 12%; Tỉ lệ mắc ung thư cổ tử cung theo độ tuổi cao nhất là ở những  
					phụ nữ gốc Việt sống ở Mỹ (43/100.000). Trong vòng 45 năm qua, tần xuất mắc ung  
					thư cổ tử cung giảm từ 45/100.000 xuống còn 8/100.000. Khi tần xuất mắc bệnh xâm  
					lấn (ung thư) giảm xuống thì tần xuất mắc bệnh tiền xâm lấn (tiền ung thư) lại tăng  
					đáng kể. Tỉ lệ sống 5 năm của bệnh nhân ung thư cổ tử cung mọi giai đoạn là 71% cho  
					phụ nữ da trắng và 57% cho phụ nữ Mỹ gốc Phi. Tỉ lệ sống phụ thuộc vào giai đoạn  
					của bệnh; khi bệnh còn khu trú tỷ lệ sống 5 năm là 92%, con số này giảm xuống 10%  
					khi bệnh đã di căn. Vì vậy, phát hiện ung thư cổ tử cung giai đoạn tiền ung thư là một  
					biện pháp hữu hiệu chăm sóc sức khỏe phụ nữ.  
					Trang 9  
				Năm 1943, Georges Papanicolaou đã đưa ra phương pháp chẩn đoán các tế bào  
					cổ tử cung giai đoạn tiền ung thư. Phương pháp này dựa vào mẫu xét nghiệm Pap để có  
					thể xác định các tế bào cổ tử cung tiền ung thư, nhằm đem lại hiệu quả điều trị cao cho  
					người bệnh. Chương trình tầm soát tế bào học British Columbia ở Canada  
					
					khi đưa việc khám sàng lọc Pap vào khu dân cư tại British Columbia. Do đó mà hiện  
					nay, phương pháp này được sử dụng phổ biến trên toàn thế giới không chỉ vì hiệu quả  
					của nó, mà còn vì giá thành của nó rẻ.  
					Tại Đan Mạch, mặc dù có chương trình khám sàng lọc trên diện rộng, nhưng  
					mỗi năm lại có hơn 500 ca mới được phát hiện, trong đó có khoảng 5% chẩn đoán âm  
					tính giả (không tìm ra bệnh). Cách hiệu quả nhất để khắc phục vấn đề này là thực hiện  
					tầm soát lại toàn bộ mẫu xét nghiệm bằng phương pháp thủ công. Tuy nhiên, điều này  
					khó có thể thực hiện được vì vấn đề chi phí và số lượng bác sĩ giải phẫu bệnh. Vì vậy,  
					việc khảo sát tự động bằng máy tính là một biến đổi lớn. Một số hệ thống chẩn đoán  
					ung thư cổ tử cung tự động và bán tự động cũng đã hoàn thành, nhưng chi phí cho  
					chúng lại đắt hơn chi phí đào tạo bác sĩ chuyên khoa. Do đó mà khoa Giải phẫu bệnh  
					của trường đại học Herlev kết hợp với công ty thương mại DIMAC đã thực hiện cơ sở  
					dữ liệu gồm các ảnh tế bào cổ tử cung cùng kết quả phân lớp loại tế bào chính xác để  
					có thể phát triển các ứng dụng công nghệ thông tin trong lĩnh vực này. Đề tài này sử  
					dụng toàn bộ dữ liệu lấy từ đây. Hệ thống suy luận mờ sẽ sử dụng bộ dữ liệu này để  
					thực hiện phân lớp tế bào cổ tử cung.  
					1.2.Mục đích của đề tài  
					Đề tài được thực hiện với một số mục đích sau:  
					¾ Phát hiện những tế bào cổ tử cung có thay đổi bất thường, và xác định mức  
					độ thay đổi của chúng (nhẹ, vừa, nặng), những thay đổi này còn gọi là loạn  
					sản và chúng cũng chính là nguyên nhân gây ra ung thư cổ tử cung sau này.  
					Trang 10  
				¾ Giảm tỷ lệ chẩn đoán âm tính giả và dương tính giả  
					¾ Giúp các sinh viên y khoa dễ dàng tiếp cận với việc chẩn đoán tế bào học,  
					giảm thiểu được chi phí đào tạo, huấn luyện bác sĩ  
					¾ Giúp các bác sĩ giải phẫu bệnh kiểm tra lại các mẫu xét nghiệm đã chẩn  
					đoán; và nếu được thử nghiệm nhiều thì chương trình có thể thực hiện sàng  
					lọc bước đầu, loại bỏ những mẫu xét nghiệm không nghi vấn và các bác sĩ  
					chỉ cần kiểm tra lại các mẫu có những thay đổi bất thường.  
					1.3.Mẫu xét nghiệm Pap  
					Xét nghiệm Pap là một phương pháp y khoa dùng để xác định ung thư cổ tử  
					cung trong giai đoạn tiến triển sớm. Nó có ý nghĩa rất lớn trong vấn đề y tế cộng đồng  
					vì thực hiện đơn giản và chi phí rẻ.  
					1.3.1.Mục đích thực hiện xét nghiệm Pap  
					Mục đích của việc khám sàng lọc bằng mẫu xét nghiệm Pap là nhằm chẩn đoán  
					các thay đổi “ác tính” trong tế bào ở giai đoạn tiền ung thư trước khi chúng tiến triển  
					thành ung thư.  
					1.3.2.Cách thực hiện mẫu xét nghiệm Pap  
					Dùng chổi y khoa hoặc que gỗ lấy mẫu xét nghiệm từ cổ tử cung, quét lên một  
					miếng thủy tinh mỏng, hình chữ nhật để thu được một mẫu Pap. Mẫu này sau đó sẽ  
					được nhuộm theo phương pháp Papanicolaou. Bằng cách này, đặc điểm của những tế  
					bào khác nhau sẽ có màu khác nhau, dễ phân biệt dưới kính hiển vi. Sau đó, các bác sĩ  
					giải phẫu bệnh sẽ khảo sát trực tiếp trên kính hiển vi. Việc này làm tốn nhiều thời gian  
					mà tỷ lệ lỗi lại rất cao khi mà mỗi mẫu như vậy có thể chứa đến 300000 tế bào.  
					Trang 11  
				1.3.3.Các tế bào trong mẫu xét nghiệm Pap  
					1.3.3.1.Cấu trúc cổ tử cung  
					Cổ tử cung được trải bởi các mô tế bào gai và mô tế bào trụ, trong đó mỗi mô  
					gồm nhiều loại tế bào khác nhau. Mô tế bào gai được tìm thấy ở phần dưới của cổ tử  
					cung, trái lại mô tế bào trụ được tìm thấy ở phần trên. Vùng chuyển tiếp (mô trung  
					gian) giữa hai phần trên và dưới là nơi có cả hai loại mô tế bào này, gọi là mô trung  
					gian (Hình 1.1).  
					Hình 1-1: Cấu trúc mô tế bào ở cổ tử cung  
					1.3.3.2.Mô tế bào gai  
					Mô tế bào gai có 4 lớp tế bào (Hình 1.2). Tế bào gai bắt đầu hình thành từ lớp  
					đáy, và khi trưởng thành chúng chuyển qua lớp cận đáy, lớp trung gian và cuối cùng là  
					lớp bề mặt. Như vậy, các tế bào lớp đáy sẽ phân chia và phân phát tế bào cho các lớp  
					trên nó. Khi các tế bào trưởng thành và di chuyển giữa các lớp, chúng thay đổi hình  
					dạng, màu sắc và các đặc tính khác. Khi đến lớp bề mặt, chúng sẽ bị đào thải và được  
					Trang 12  
				thay thế bằng các tế bào đến sau. Lớp đáy có các tế bào hình tròn nhỏ, với nhân lớn và  
					bào tương nhỏ. Khi trưởng thành, nhân sẽ càng lúc càng nhỏ, trong khi bào tương càng  
					lớn và hình dạng tế bào càng ít tròn đi. Tế bào cận đáy (Hình 1.3a) dạng tròn, kích  
					thước khoảng 300µm2 và kích thước nhân là 50µm2. Tế bào trung gian (Hình 1.3b) và  
					tế bào bề mặt (Hình 1.3c) có dạng đa giác, kích thuớc tương ứng 800 - 1200µm2 và  
					1600µm2, và kích thước nhân tương ứng là 35µm2 và 20µm2.  
					Hình 1-2: Phân lớp trong mô tế bào gai  
					Trang 13  
				Hình 1-3: (a) tế bào gai cận đáy, (b) tế bào gai trung gian, (c) tế bào gai bề mặt,  
					(d) tế bào trụ, (e) tế bào loạn sản nhẹ, (f) tế bào loạn sản vừa, (g) tế bào loạn sản nặng  
					1.3.3.3.Mô tế bào trụ  
					Mô tế bào trụ chỉ chứa một lớp tế bào duy nhất, lớp đáy (Hình 1.4). Lớp đáy ở  
					đây chứa các tế bào trụ (Hình 1.3d) và các tế bào dự trữ. Các tế bào dự trữ sẽ phân chia  
					thành các tế bào dự trữ mới và các tế bào trụ. Khi nhìn tế bào trụ từ bên hông, chúng có  
					hình trụ với nhân ở dưới đáy. Khi nhìn từ trên xuống, chúng nhỏ và có hình đa giác. Tế  
					bào chất có kích thước khoảng 180µm2 và nhân 50µm2.  
					Hình 1-4: Phân lớp trong mô tế bào trụ  
					Trang 14  
				1.3.3.4.Mô trung gian  
					Mô trung gian (vùng chuyển tiếp giữa mô tế bào gai và mô tế bào trụ) chứa các  
					tế bào dự trữ từ mô tế bào trụ. Khi các tế bào này trưởng thành, chúng trông như các tế  
					bào gai.  
					1.3.3.5.Các tế bào loạn sản  
					Khi thông tin di truyền của tế bào vì một lý do nào đó bị thay đổi, tế bào sẽ  
					không phân chia theo cách thông thường, và có thể tạo thành một tế bào tiền ung thư.  
					Những biến đổi ác tính trong tế bào ở giai đoạn tiền ung thư được gọi là loạn sản. Tùy  
					theo cách phân chia của các tế bào này mà nó sẽ được chẩn đoán là loạn sản hay ung  
					thư mô tế bào.  
					Loạn sản có nhiều mức độ khác nhau: loạn sản nhẹ, loạn sản vừa và loạn sản  
					nặng. Loạn sản chưa sừng hoá là loại phổ biến (chiếm 85% các ca loạn sản), phát triển  
					từ mô trung gian hoặc từ mô tế bào gai. Tế bào loạn sản nhẹ (Hình 1.3e) có nhân sáng  
					và lớn hơn tế bào bình thường. Tế bào loạn sản vừa (Hình 1.3f) có nhân tối và lớn hơn  
					tế bào loạn sản nhẹ. Tế bào loạn sản nặng (Hình 1.3g) có nhân giống như loạn sản vừa  
					nhưng bào tương nhỏ hơn.  
					1.3.3.6.Một số đặc điểm giải phẫu bệnh  
					Một số đặc điểm dưới đây được dùng cho các bác sĩ giải phẫu bệnh khi thực  
					hiện chẩn đoán trên xét nghiệm Pap bằng phương pháp thủ công:  
					¾ nhân mở rộng, tối hơn; tức là hình dạng và màu sắc của nhân biến đổi  
					¾ tỷ lệ nhân / bào tương tăng lên  
					Bảng 1.1 tóm tắt một số đánh giá các loại tế bào khác nhau và được sử dụng để  
					tham khảo.  
					Trang 15  
				Loại tế bào  
					Diện tích nhân  
					trung bình µm2  
					Diện tích bào tương  
					trung bình µm2  
					300  
					Tỷ lệ nhân / bào  
					tương %  
					20  
					Cận đáy  
					50  
					35  
					Trung gian  
					Bề mặt  
					1000  
					5
					20  
					1600  
					2
					Trụ  
					50  
					180  
					30  
					Loạn sản nhẹ  
					Loạn sản vừa  
					Loạn sản nặng  
					175  
					175  
					175  
					1000 – 1500  
					1000 – 1500  
					1000 – 1500  
					10 – 20  
					20 – 50  
					trên 50  
					Bảng 1-1: Thống kê kích thước tế bào  
					1.4.Một số nguyên nhân dẫn đến chẩn đoán sai  
					1.4.1.Nguyên nhân khách quan  
					¾ Do điều kiện trang thiết bị y tế thấp kém như: các thiết bị lấy mẫu không  
					theo tiêu chuẩn, dính quá nhiều tạp chất,… làm cho chất lượng mẫu lấy  
					được thấp.  
					¾ Ý thức người dân không cao, không chấp nhận khám sàng lọc hoặc nếu có  
					thì cũng không thực hiện theo định kì, …  
					¾ Thiếu đội ngũ cán bộ y tế có chuyên môn để thực hiện khám sàng lọc  
					1.4.2.Nguyên nhân chủ quan  
					¾ Một chẩn đoán ung thư hay tiền ung thư dựa trên các tế bào bất thường  
					trong mẫu Pap được xác định bởi các bác sĩ giải phẫu bệnh. Một mẫu có thể  
					chứa hàng trăm đến hàng ngàn tế bào, nhưng đa số là tế bào bình thường,  
					chỉ có một số trong chúng ác tính, cho nên các tế bào bất thường có thể bị  
					bỏ sót do bác sĩ không tập trung hoặc mệt mỏi...  
					Trang 16  
				¾ Nếu mẫu xét nghiệm có chứa các tế bào ung thư hoặc tiền ung thư nhưng  
					trong mẫu nhỏ lấy ra để chẩn đoán lại không có thì chẩn đoán sẽ bị lỗi.  
					¾ Các thay đổi tế bào học do vi khuẩn, vi rút, thuốc, hoặc sự thay đổi hóc môn  
					có thể gần giống với các thay đổi ác tính, gây phức tạp thêm nhiệm vụ của  
					bác sĩ. Do đó, khi các tế bào bất thường được xác định, việc phân loại chính  
					xác mức độ thay đổi ác tính hay tiền ác tính mang tính chủ quan cao.  
					1.5.Một số hệ thống phân lớp tế bào tự động và bán tự động  
					1.5.1.Lịch sử phát triển  
					Hệ thống bán tự động đầu tiên là Cytoanalyzer, xuất hiện vào đầu thập niên 50,  
					do Mellors thực hiện. Hệ thống này đo được đường kính nhân và bào tương cùng với  
					độ sáng của chúng. Tuy nhiên nó không thể phân đoạn được các cụm tế bào gần nhau,  
					và đây cũng chính là mối quan tâm của các hệ thống hiện nay. Hệ thống tuy không đưa  
					ra được một kết quả mong muốn được nhưng nó là một bước ngoặt cho các hướng phát  
					triển kế tiếp.  
					Một sản phẩm khác xuất hiện vào giữa những năm 60 là TICAS. Hệ thống này  
					sử dụng máy tính loại DEC LINC – 8 để phát triển các phương pháp phân loại nhạy  
					cảm hơn so với các kĩ thuật tế bào học. Nhưng do giới hạn phần cứng của máy tính nên  
					việc khảo sát dữ liệu bị giới hạn trong 475 tế bào. Vì vậy mà việc ứng dụng vào thực tế  
					bị hạn chế. Tuy nhiên, sản phẩm đã thành công trong việc nghiên cứu các hệ thống  
					phân loại trong tương lai. Vào thập niên 80, TICAS được mở rộng thành microTICAS,  
					sử dụng kính hiển vi, kết hợp camera kĩ thuật số và máy IBM chạy trên DOS phiên bản  
					2.0.  
					Năm 1965, Husain đã xây dựng một hệ thống chẩn đoán tự động, phát hiện các  
					tế bào có nhân lớn và tối thông qua một hệ thống kính hiển vi điện tử, để có thể xác  
					định tế bào là ung thư hay tiền ung thư. Đầu những năm 70, ông tiếp tục phát triển các  
					Trang 17  
				khả năng của hệ thống này, giúp giảm tỷ lệ lỗi chẩn đoán một cách đáng kể (FN 17%,  
					FP 34%).  
					Giữa thập niên 70, Zahniser, Oud, Raajimakers, Vooys và van de Walle đã xây  
					dựng hệ thống BioPEPR, bao gồm các máy tính với bộ nhớ 28K, cho phép thực hiện  
					các phần mềm tinh vi, đưa ra kết quả từ 120 đến 180 mẫu xét nghiệm 1 giờ (FP 10%,  
					FN 1%).  
					Năm 1989, khi phần cứng và phần mềm được cải tiến đáng kể thì hệ thống  
					LEYTAS xuất hiện, cho kết quả FN là 0.3% và FP là 13%, nhưng do qui trình lấy mẫu  
					mất thời gian và đòi hỏi sự tác động đáng kể của con người nên không được ứng dụng  
					rộng rãi.  
					Tất cả những người thiết kế các hệ thống này đều nhận thấy rằng khám sàng lọc  
					cổ tử cung tự động là một vấn đề cực kì khó khăn. Từ đó đến nay cũng có nhiều hệ  
					thống mới ra đời, nhưng vẫn chỉ có thể cho hiệu suất cao khi có bàn tay con người trợ  
					giúp.  
					1.5.2.Một số hệ thống khám sàng lọc thương mại  
					Tổ chức FDA của Mĩ thông qua hai hệ thống khám sàng lọc tự động:  
					¾ Hệ thống PAPNET là một thiết bị khám sàng lọc nhằm bổ sung thêm cho hệ  
					thống khám thủ công. Từ mỗi mẫu, hệ thống chọn 128 vùng khả nghi và lưu  
					lại cho các bác sĩ giải phẫu học xem xét.  
					¾ Hệ thống AutoPap 300 nhận ra các mẫu âm tính, và được dùng cho việc sàng  
					lọc lại các mẫu đã khám bằng phương pháp thủ công.  
					Cả hai hệ thống đều làm giảm tỷ lệ chẩn đoán bệnh sai, nhưng đồng thời chúng  
					cũng làm tăng chi phí xét nghiệm.  
					Trang 18  
				1.6.Phát biểu vấn đề  
					Việc phân loại tế bào cổ tử cung dựa trên mẫu Pap được thực hiện theo 3 bước  
					chính:  
					¾ Phân đoạn ảnh: đánh dấu từng vùng ảnh riêng biệt: nhân, bào tương và nền  
					¾ Trích đặc trưng: dựa vào các vùng ảnh thu được ở bước trên, chúng ta có thể  
					trích ra các đặc trưng của tế bào để thực hiện phân loại  
					¾ Phân loại tế bào dựa trên các đặc trưng đã có, dùng hệ thống suy luận mờ sử  
					dụng mạng thích nghi để thực hiện.  
					Có thể hình dung các bước thực hiện theo sơ đồ sau:  
					Dữ liệu huấn luyện  
					Ảnh tiền xử lý  
					Dữ liệu thử nghiệm  
					Ảnh tiền xử lý  
					Trích đặc trưng  
					Đặc trưng tế bào  
					Trích đặc trưng  
					Đặc trưng tế bào  
					Huấn luyện phân lớp  
					Phân lớp tế bào  
					Phân lớp  
					Chuẩn đoán bệnh  
					Hình 1-5: Sơ đồ các bước thực hiện chẩn đoán  
					Trang 19  
				1.7.Các tiêu chuẩn đánh giá mức độ thực hiện hệ thống  
					Các giá trị sau được dùng để đánh giá mức độ thực hiện việc phân lớp tự động  
					tế bào:  
					¾ Sai số trung bình bình phương lỗi (RMSE)  
					¾ Tỷ lệ âm tính giả (FN%)  
					¾ Tỷ lệ dương tính giả (FP%)  
					¾ Độ nhạy (Sensitivity)  
					¾ Độ đặc trưng (Specificity)  
					¾ Giá trị dự đoán dương tính (PP%)  
					¾ Giá trị dự đoán âm tính (NP%)  
					1.7.1.Sai số trung bình bình phương lỗi - RMSE  
					RMSE là độ sai khác giữa phân lớp d đích và giá trị thực y có được nhờ vào việc  
					phân lớp tự động tế bào. RMSE khác với độ lệch chuẩn σ ở chỗ σ là độ lệch chuẩn so  
					với giá trị µ của y:  
					n
					2
					(
					di − yi  
					)
					∑
					i=1  
					RMSE =  
					(1.1)  
					(1.2)  
					n
					n
					2
					(
					µ − yi  
					)
					∑
					i=1  
					σ =  
					n
					trong đó, n = |d| = |y| là số lượng tế bào được phân lớp.  
					1.7.2.Tỷ lệ âm tính giả - FN%  
					FN% là tỷ lệ tế bào được phân lớp bình thường nhưng thực chất là loạn sản.  
					FN ×100%  
					FN% =  
					= 100% − Sensitivity  
					(1.3)  
					TP + FN  
					với TP là số lượng tế bào phân lớp dương tính đúng.  
					Trang 20  
				FN là số lượng tế bào phân lớp âm tính sai.  
					1.7.3.Tỷ lệ dương tính giả - FP%  
					FP% là tỷ lệ tế bào được phân lớp loạn sản nhưng thực ra là bình thường.  
					FP×100%  
					FP% =  
					= 100% − Specification  
					(1.4)  
					TN + FP  
					với TN là số lượng tế bào phân lớp âm tính đúng.  
					FP là số lượng tế bào phân lớp dương tính sai.  
					1.7.4.Độ nhạy - Sensitivity  
					Độ nhạy đánh giá xác suất phân lớp tự động tìm thấy tế bào loạn sản.  
					TP×100%  
					Sensitivity =  
					(1.5)  
					TP + FN  
					Như vậy, số lượng tế bào loạn sản trong cơ sở dữ liệu là P = TP + FN.  
					1.7.5.Độ đặc trưng - Specificity  
					Độ đặc trưng là xác suất phân lớp tự động tìm ra tế bào bình thường.  
					TN ×100%  
					Specificity =  
					(1.6)  
					TN + FP  
					Như vậy, số lượng tế bào bình thường trong cơ sở dữ liệu là N = TN + FP  
					1.7.6.Giá trị dự đoán dương tính – PP%  
					PP% là tỷ lệ tế bào được phân lớp loạn sản đúng.  
					TP ×100%  
					PP% =  
					(1.7)  
					TP + FP  
					1.7.7.Giá trị dự đoán âm tính – NP%  
					NP% là tỷ lệ tế bào được phân lớp bình thường đúng.  
					TN ×100%  
					NP% =  
					(1.8)  
					TN + FN  
					Trang 21  
				Chương 2: HỆ SUY LUẬN MỜ DỰA TRÊN MẠNG  
					THÍCH NGHI  
					Chương này đưa ra một cấu trúc và thủ tục học của hệ thống suy luận mờ dựa  
					trên mạng thích nghi, gọi tắt là ANFIS. Thông qua việc sử dụng thủ tục học lai ghép,  
					ANFIS có thể tạo một ánh xạ dữ liệu nhập - xuất dựa trên tri thức con người (dưới  
					dạng các luật mờ nếu - thì) và dữ liệu nhập - xuất thực. Cấu trúc ANFIS được dùng để  
					mô hình hóa các hàm phi tuyến, xác định trực tiếp các thành phần phi tuyến trong một  
					hệ thống điều khiển, và dự đoán một loạt sự kiện hỗn loạn với một hiệu quả nhất định.  
					2.1.Giới thiệu sơ lược về mô hình nơron - mờ  
					Một mạng nơron với các trọng số được điều chỉnh có thể xem như là một thiết  
					bị điều khiển tự động nhờ vào tính chất hồi qui phi tuyến của các đối tượng rời rạc.  
					Tuy nhiên tri thức được lưu trữ trong mạng không rõ ràng, không mô tả được những  
					mối liên hệ giữa dữ liệu nhập và dữ liệu xuất, mà chỉ có thể xác định các mối liên hệ  
					này thông qua những tham số thích nghi của mạng. Trái lại, một luật mờ nếu – thì lại  
					có thể diễn tả được các mối liên hệ đó dưới dạng ngôn ngữ tự nhiên, nhưng lại không  
					có khả năng điều chỉnh luật cho phù hợp. Hai vấn đề này được kết hợp lại tạo thành  
					một hệ thống nơron - mờ nhằm đạt được khả năng “đọc” và “học” cùng một lúc. Các  
					luật thu được từ hệ thống này có thể điều chỉnh phù hợp với dữ liệu phát sinh mô hình,  
					và đối với các ứng dụng điều khiển tự động, mô hình nơron - mờ có thể tích hợp với  
					các luật chuyên gia nhằm đưa ra những kết quả chính xác.  
					Bên cạnh các luật chuyên gia, các luật trích ra từ dữ liệu cũng là một hình thức  
					mô hình hoá hệ thống điều khiển tự động, chẳng hạn như trong Nhận dạng, khai mỏ dữ  
					liệu,... Mục tiêu đưa ra các luật này là nhằm giảm độ phức tạp của vấn đề cũng như  
					lượng dữ liệu liên quan đến vấn đề. Có rất nhiều phương pháp phân tích dữ liệu để đưa  
					Trang 22  
				ra hệ thống các luật để có thể thực hiện một sự kết hợp tối ưu giữa logic mờ và mạng  
					nơron.  
					Các nghiên cứu về mạng nơron đã bắt đầu từ thập niên năm 40, và logic mờ từ  
					thập niên 60, nhưng mô hình nơron - mờ là một lĩnh vực mới. Năm 1992, Roger Jang  
					đã đề xuất mô hình ANFIS nhằm đáp ứng việc xây dựng một tập luật mờ nếu - thì với  
					các hàm thành viên xấp xỉ dữ liệu nhập - xuất đích. Kết quả là, một hệ thống suy luận  
					mờ dựa trên mạng thích nghi không chỉ thể hiện tốt thông tin ngôn ngữ (các luật ngôn  
					ngữ) từ các chuyên gia, mà còn phù hợp với việc sử dụng dữ liệu dạng số để thu được  
					mức độ thực hiện tốt hơn.  
					2.2.Hệ thống suy luận mờ  
					2.2.1.Tập mờ  
					Trong tập rõ, chúng ta có thể xác định rõ một phần tử là thành viên hay không là  
					thành viên của một tập rõ cho trước. Tuy nhiên trong đời sống thực tế, có nhiều vấn đề  
					mà chúng ta không biết rõ là đúng hay sai, điều này đồng nghĩa với việc tồn tại một  
					phần tử x mà ta không thể xác định rõ ràng tính thành viên của x trong tất cả các tập rõ  
					mà chúng ta đã biết. Để giải thích vấn đề này, Dr. Zadeh đã đưa ra khái niệm tập mờ và  
					khái niệm hàm thành viên để thể hiện tính thành viên của biến trong tập mờ.  
					Tập mờ A trong X là tập các phần tử có dạng A = {(x, µA(x)) | x ∈ X}, trong đó x  
					là phần tử của tập vũ trụ X và µA(x) là giá trị thể hiện tính thành viên của x trong tập  
					mờ A, với 0 ≤ µA  
					(
					x
					)
					≤ 1.  
					Nói cách khác, tập mờ A chính là nhãn được gán cho ánh xạ:  
					µA : X →  
					[
					0,1  
					]
					x → y = µA  
					x
					)
					Trang 23  
				Xét về mặt ý nghĩa, tập mờ là một khái niệm dùng để thể hiện mức độ phụ thuộc  
					vào một tính chất nào đó của các phần tử trong khôn gian vũ trụ. Ví dụ như tính chất  
					nóng, mát, lạnh của tập nhiệt độ…  
					2.2.2.Luật mờ  
					Luật mờ là biểu thức điều kiện có dạng “NẾU A THÌ B”, trong đó A và B là  
					nhãn của các tập mờ được mô tả bằng cách xấp xỉ các hàm thành viên. Nhờ vào dạng  
					rút gọn, luật mờ thường được dùng để thiết lập những phương thức lập luận không  
					chính xác, nhằm thể hiện tính đa dạng trong tri thức của con người. Ví dụ sau mô tả  
					một sự kiện đơn giản là (đây là luật mờ loại Mamdani):  
					Nếu nhiệt độ cao, thì giá máy lạnh tăng.  
					trong đó nhiệt độ và giá máy lạnh là các biến ngôn ngữ, cao và tăng là các giá  
					trị ngôn ngữ hoặc các nhãn được mô tả bởi các hàm thành viên.  
					Một dạng khác của luật mờ do Takagi và Sugeno đề xuất, có các tập mờ chỉ  
					xuất hiện trong phần giả thuyết của luật. Ví dụ (đây là luật mờ loại Sugeno):  
					Nếu lưu lượng dòng chảy cao thì mực nước sông = k* lưu lượng dòng chảy.  
					trong đó, cao là phần giả thuyết được mô tả bởi hàm thành viên xấp xỉ. Tuy  
					nhiên, phần kết luận được định nghĩa bởi phương trình theo biến lưu lượng dòng chảy.  
					Cả hai loại luật mờ trên đều được mở rộng trong cả hai lĩnh vực mô hình hóa và  
					điều khiển tự động. Bởi vì lợi ích của các nhãn ngôn ngữ và các hàm thành viên, một  
					luật mờ có thể nắm bắt dễ dàng qui luật điều khiển của con người.  
					2.2.3.Hệ thống suy luận mờ  
					2.2.3.1.Cấu trúc  
					Một hệ thống suy luận mờ gồm 5 khối cơ bản sau (Hình 2.1):  
					¾ Một cơ sở luật chứa các luật mờ nếu - thì  
					Trang 24  
				¾ Một cơ sở dữ liệu định nghĩa các hàm thành viên của các tập mờ được sử  
					dụng trong các luật mờ  
					¾ Một đơn vị thực hiện quyết định thực hiện phép toán suy luận trên các  
					luật  
					¾ Một suy luận mờ chuyển đổi dữ liệu thô thành các mức độ kết nối với biến  
					ngôn ngữ  
					¾ Một suy luận khử mờ chuyển đối các kết quả mờ của suy luận thành dữ  
					liệu thô  
					Thông thường, cơ sở luật và cơ sở dữ liệu dựa trên tri thức chuyên gia.  
					cơ sở tri thức  
					cơ sở dữ liệu  
					cơ sở luật  
					Dữ liệu nhập  
					Dữ liệu xuất  
					khử  
					mờ  
					hoá  
					mờ  
					hoá  
					(thô)  
					đơn vị thực hiện quyết định  
					(thô)  
					(mờ)  
					(mờ)  
					Hình 2-1: Hệ thống suy luận mờ  
					2.2.3.2.Các bước thực hiện suy luận  
					Các bước lập luận mờ (phép toán suy luận trên các luật mờ) được thực hiện bởi  
					các hệ thống suy luận mờ (Hình 2.1):  
					1. So sánh dữ liệu nhập với các hàm thành viên trong phần giả thuyết để thu được  
					các giá trị hàm thành viên (độ đo tính tương thích) của mỗi nhãn ngôn ngữ  
					(bước này thường được gọi là mờ hóa).  
					Trang 25  
				2. Kết nối (thông qua toán tử chuẩn T, thường là toán tử nhân hoặc toán tử min)  
					các giá trị hàm thành viên trong phần giả thuyết để lấy ngưỡng kích hoạt của  
					mỗi luật.  
					3. Phát sinh các kết luận đủ tiêu chuẩn (hoặc mờ hoặc thô) của mỗi luật dựa trên  
					ngưỡng kích hoạt.  
					4. Tập hợp lại các kết luận đủ tiêu chuẩn để đưa ra một dữ liệu xuất thô (bước này  
					được gọi là khử mờ).  
					2.2.3.3.Các loại hệ thống suy luận mờ  
					Dựa trên các loại lập luận mờ và các luật mờ được dùng, hầu hết các hệ thống  
					suy luận mờ có thể được phân làm 3 loại chính:  
					Loại 1: Toàn bộ dữ liệu xuất là trung bình trọng số các dữ liệu xuất thô của mỗi  
					luật có được do ngưỡng kích hoạt của luật (toán tử tích hoặc min tổ hợp các giả thuyết)  
					và các hàm thành viên dữ liệu xuất.  
					Loại 2: Toàn bộ dữ liệu xuất thu được bằng cách dùng toán tử max cho các dữ  
					liệu xuất mờ đủ tiêu chuẩn (cực tiểu hóa độ ngưỡng kích hoạt và hàm thành viên dữ  
					liệu xuất của mỗi luật). Các ý tưởng khác nhau được đề xuất để chọn lựa dữ liệu xuất  
					thô cuối cùng dựa trên toàn bộ dữ liệu xuất mờ; một số trong chúng là tâm của diện  
					tích, đường phân giác của diện tích, trung bình cực đại, tiêu chuẩn cực đại,…  
					Loại 3: Các luật mờ loại Takagi và Sugeno được sử dụng. Dữ liệu xuất của mỗi  
					luật là một tổ hợp tuyến tính các dữ liệu nhập, cộng với một số hạng không đổi, và dữ  
					liệu xuất cuối cùng chính là trung bình trọng số các dữ liệu xuất trong mỗi luật.  
					Hình 2.2 ví dụ về một hệ thống suy luận mờ hai luật, hai dữ liệu nhập để chỉ ra  
					các loại luật mờ và lập luận mờ khác nhau. Chú ý rằng sự khác nhau là ở phần kết luận  
					(không giảm đều hoặc hàm thành viên dạng chuông, hoặc hàm thô) và do đó mà các ý  
					tưởng khử mờ (trung bình trọng, trọng tâm của diện tích…) cũng khác nhau.  
					Trang 26  
				Hình 2-2: Các luật mờ và các hệ thống suy luận  
					2.3.Mạng thích nghi  
					2.3.1.Cấu trúc mạng  
					Hình 2-3: Mạng thích nghi  
					Một mạng thích nghi (Hình 2.3) là một mạng nhiều lớp lan truyền tiến, trong đó  
					mỗi nút thực hiện một chức năng riêng (hàm nút) trên tín hiệu vào cũng như tập các  
					tham số gắn liền với nút. Trạng thái tự nhiên của hàm nút có thể biến đổi từ nút này  
					qua nút khác, và sự lựa chọn của mỗi hàm nút dựa trên hàm ánh xạ toàn cục nhập –  
					Trang 27  
				xuất để mạng thích nghi được yêu cầu thực hiện. Chú ý rằng các liên kết trong mạng  
					thích nghi chỉ xác định hướng dữ liệu của tín hiệu giữa các nút chứ không chứa trọng  
					số.  
					Để phản ánh các khả năng thích nghi khác nhau, các nút hình tròn và hình  
					vuông được dùng trong mạng thích nghi. Một nút hình vuông (nút thích nghi) có chứa  
					tham số còn một nút hình tròn (nút cố định) thì không. Tập tham số của mạng thích  
					nghi là hợp của các tập tham số của mỗi nút thích nghi. Để thu được ánh xạ nhập –  
					xuất đích, các tham số này được cập nhật theo dữ liệu huấn luyện đã cho và thủ tục học  
					dựa trên gradient được mô tả ở phần sau.  
					2.3.2.Các luật học cơ bản  
					Giả sử rằng một mạng thích nghi đã cho có L lớp và lớp thứ k có #(k) nút.  
					Chúng ta có thể biểu thị vị trí nút thứ i trong lớp thứ k bằng (k, i), và hàm nút của nó  
					(dữ liệu xuất của nút) bằng Oik . Khi một đầu ra của nút dựa trên tín hiệu vào và tập các  
					tham số của nó, chúng ta có:  
					Oik = Oik  
					O1k−1,...O#k−k1−1) ,a,b,c,...  
					(2.1)  
					(
					trong đó a, b, c,…là các tham số gắn liền với nút; Oik được dùng cho cả dữ liệu  
					nhập và dữ liệu xuất của nút và hàm nút.  
					Giả sử rằng dữ liệu huấn luyện đã cho có P mục, chúng ta có thể định nghĩa độ  
					đo lỗi (hoặc hàm năng lượng) cho mục thứ p (1 ≤ p ≤ P) của mục dữ liệu huấn luyện  
					như tổng các lỗi bình phương:  
					2
					#
					(
					L
					)
					E =  
					(
					T
					− OmL, p  
					)
					(2.2)  
					∑
					p
					m, p  
					m=1  
					trong đó Tm, p là thành phần thứ m của vectơ ra đích thứ p, và OmL, p thành phần thứ m  
					P
					của vectơ ra thực sự của vectơ vào thứ p. Vì vậy độ đo lỗi toàn cục là E = E .  
					∑
					p
					p=1  
					Trang 28  
				Để phát triển thủ tục học thực hiện giảm gradient trong E toàn bộ không gian  
					∂Ep  
					tham số, đầu tiên phải tính tỷ lệ lỗi  
					cho dữ liệu huấn luyện thứ p và cho mỗi đầu  
					∂O  
					ra của nút O. Tỷ lệ lỗi cho nút đầu ra tại (L, i) được suy ra từ phương trình (2.2) là:  
					∂Ep  
					= −2  
					(
					Ti, p − OiL, p  
					)
					(2.3)  
					∂OiL, p  
					Đối với nút ẩn tại (k, i), tỷ lệ lỗi được tính theo chuỗi vi phân:  
					k+1  
					m, p  
					#
					(k+1)  
					∂Ep  
					∂Oik, p  
					∂Ep ∂O  
					=
					(2.4)  
					∑
					k+1  
					∂O  
					∂Oik, p  
					m=1  
					m, p  
					trong đó 1 ≤ k ≤ L – 1. Chính là, tỷ lệ lỗi của nút ẩn có thể được mô tả như một tổ hợp  
					tuyến tính các tỷ lệ lỗi của các nút trong lớp kế tiếp. Vì vậy ∀k, ∀i, sao cho 1 ≤ k ≤ L  
					∂Ep  
					và 1 ≤ i ≤ #(k), chúng ta có thể tính  
					qua phương trình (2.3) và (2.4).  
					∂Oik, p  
					Nếu α là một tham số của mạng thích nghi đã cho, ta có:  
					∂O∗  
					∂α  
					∂Ep  
					∂Ep  
					=
					(2.5)  
					∑
					O ∈S ∂O∗  
					∗
					∂α  
					trong đó S là tập các nút mà đầu ra của nó phụ thuộc α; Thì đạo hàm độ đo lỗi toàn cục  
					E tương ứng α là:  
					P
					∂Ep  
					∂E  
					∂α  
					=
					(2.6)  
					∑
					∂α  
					p=1  
					Suy ra, công thức cập nhật cho tham số chung α là:  
					∂E  
					∆α = −η  
					∂α  
					(2.7)  
					(2.8)  
					trong đó η là tốc độ học được tính bằng:  
					k
					η =  
					2
					∂E  
					∂α  
					⎛
					⎜
					⎞
					⎟
					∑
					α
					⎝
					⎠
					Trang 29  
				Tải về để xem bản đầy đủ
Bạn đang xem 30 trang mẫu của tài liệu "Luận văn Ứng dụng mô hình nơron - mờ trong việc phát hiện tế bào cổ tử cung giai đoạn tiền ung thư", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.
        
        
        File đính kèm:
luan_van_ung_dung_mo_hinh_noron_mo_trong_viec_phat_hien_te_b.pdf

