Đồ án tôt nghiệp - Tìm hiểu phương pháp làm mảnh ảnh

pdf
Số trang Đồ án tôt nghiệp - Tìm hiểu phương pháp làm mảnh ảnh 55 Cỡ tệp Đồ án tôt nghiệp - Tìm hiểu phương pháp làm mảnh ảnh 854 KB Lượt tải Đồ án tôt nghiệp - Tìm hiểu phương pháp làm mảnh ảnh 1 Lượt đọc Đồ án tôt nghiệp - Tìm hiểu phương pháp làm mảnh ảnh 3
Đánh giá Đồ án tôt nghiệp - Tìm hiểu phương pháp làm mảnh ảnh
4.7 ( 19 lượt)
Nhấn vào bên dưới để tải tài liệu
Đang xem trước 10 trên tổng 55 trang, để tải xuống xem đầy đủ hãy nhấn vào bên trên
Chủ đề liên quan

Nội dung

Đồ án tôt nghiệp ảnh Tìm hiểu phương pháp làm mảnh LỜI NÓI ĐẦU Ngày nay khoa học nhận dạng có một vai trò vô cùng quan trọng bởi các ứng dụng to lớn của nó trong nhiều lĩnh vực khoa học.Thining (làm mảnh) là một bước tiền xử lý nhằm phục vụ cho những bước tiếp theo trong quá trình nhận dạng. Đồ án này giới thiệu các khái niệm, cách phân loại, và một số thuật toán làm mảnh, những đánh giá cho từng loại thuật toán. Cấu trúc của đồ án gồm 4 chương bao gồm 3 chương lý thuyết và 1 chương về cài đặt thực nghiệm. Chương 1: Tổng quan về làm mảnh ảnh. Chương 2: Các thuật toán làm mảnh tuần tự. Chương 3: Các thuật toán làm mảnh song song. Chương 4: Cài đặt thực nghiệm. Sinh viên Hà Đức Kiên - CT702 Trang 1 Đồ án tôt nghiệp ảnh Tìm hiểu phương pháp làm mảnh CHƯƠNG 1 TỔNG QUAN VỀ LÀM MẢNH ẢNH 1.1 Xử lý ảnh Cũng như xử lý dữ liệu bằng đồ họa, xử lý ảnh số là một lĩnh vực của tin học ứng dụng. Xử lý ảnh số bao gồm các phương pháp và kỹ thuật để biến đổi, để truyền tải hoặc mã hoá các ảnh tự nhiên . Mục đích của xử lý ảnh gồm: ¾ Thứ nhất, biến đổi ảnh và làm đẹp ảnh. ¾ Thứ hai, tự động nhận dạng ảnh hay đoán nhận ảnh và đánh giá các nội dung của ảnh. Hình 1: các giai đoạn chính trong xử lý ảnh 1.1.1 Biểu diễn ảnh Trong xử lý ảnh bằng máy tính , ảnh phải được đưa về dạng biểu diễn số . Một ảnh được biểu diễn dưới dạng một ma trận hai chiều. Mỗi phần tử của ma trận biểu diễn cho mức xám hay cường độ của điểm ảnh tương ứng. Mỗi phần tử trong ma trận được gọi là phần tử ảnh (pixel). Tuỳ theo vùng các giá trị xám của điểm ảnh, mà các ảnh được phân chia ra thành ảnh màu, ảnh xám, hay ảnh nhị phân. Khi trên một ảnh chỉ tồn tại các Sinh viên Hà Đức Kiên - CT702 Trang 2 Đồ án tôt nghiệp Tìm hiểu phương pháp làm mảnh ảnh giá trị 0 hoặc 1 thì ta nói đó là một ảnh nhị phân hoặc ảnh đen trắng và các điểm ảnh của nó gọi là điểm ảnh nhị phân . Mỗi điểm ảnh nhị phân chỉ cần dùng 1 bit để biểu diễn. Với ảnh xám nếu dùng 1 Byte để biểu diễn thì số mức xám có thể biểu diễn là 28 hay 256 màu. Mỗi mức xám được biểu diễn dưới dạng số nguyên nằm trong khoảng từ 0 đến 255. Với ảnh màu , việc biểu diễn tương tự ảnh xám chỉ khác các phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm đỏ (red) , lục (green) , lam (blue) . Để biểu diễn cho một điểm ảnh cần 24 bit , chia làm 3 khoảng 8 bit , mỗi khoảng biểu diễn cho cường độ sáng của một trong các màu chính. 1.1.2 Nhận dạng Nhận dạng là một ứng dụng quan trọng của làm mảnh. Nhận biết và đánh giá nội dung của ảnh(nhận dạng) là sự phân tích một hình ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu. Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của một đối tượng trên ảnh , tách cạnh , phân đoạn ảnh .v..v... Kỹ thuật này được dùng nhiều trong y học ( xử lý tế bào , nhiễm sắc thể ) , nhận dạng chữ trong văn bản. Nhận dạng là quá trình liên quan đến mô tả đối tượng mà người ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính của đối tượng. Có hai kiểu mô tả đối tượng : • Mô tả theo tham số ( nhận dạng theo tham số) • Mô tả theo cấu trúc ( nhận dạng theo cấu trúc) Trên thực tế người ta đã áp dụng nhận dạng chữ ( chữ cái , chữ số , chữ có dấu) Hiện nay có các phương pháp nhận dạng chữ bằng phương pháp cấu trúc , véctơ hoá đường nét các ảnh bản đồ , nhận dạng theo cấu trúc topo.... Sinh viên Hà Đức Kiên - CT702 Trang 3 Đồ án tôt nghiệp Tìm hiểu phương pháp làm mảnh ảnh Nhận dạng chữ in hoặc đánh máy phục vụ cho quá trình tự động đọc tài liệu , tăng tốc độ và chất lượng thu nhận thông tin. Nhận dạng chữ viết tay (với mức độ ràng buộc về cách viết , kiểu chữ ... ) phục vụ cho nhiều lĩnh vực. Ngoài hai kỹ thuật nhận dạng trên còn kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng nơron đang được áp dụng và cho kết quả khả quan. 1.2 Xương và các phương pháp tìm xương 1.2.1. Thế nào là xương và làm mảnh ảnh Kết quả của việc làm mảnh là đưa ra xương của đối tượng ảnh , vậy “xương ảnh là gì?”. Thuật ngữ “xương” dùng để chỉ kết quả mà không quan tâm đến hình dạng chuẩn của mẫu hoặc các phương thức được sử dụng. Cho đến nay, vẫn chưa có một định nghĩa đáng thuyết phục nào về xương ảnh. Vì vậy việc tìm xương ảnh, tức là tìm ra những nét đặc trưng cho một đối tượng ảnh, là một điều hết sức khó khăn. Xương được coi như hình dạng cơ bản của một đối tượng, với số ít các điểm ảnh cơ bản. Ta có thể lấy được các thông tin về hình dạng nguyên bản của một đối tượng thông qua xương. Vị trí, sự định hướng, độ dài của một đoạn xương đặc trưng cho đoạn ảnh đó. Nhiệm vụ đặt ra là phải định rõ đặc điểm thành phần của đoạn ảnh. Các kỹ thuật tìm xương luôn là chủ đề nghiên cứu trong xử lý ảnh. Do tính phức tạp của nó , mặc dù có những nỗ lực cho việc phát triển các thuật toán tìm xương nhưng các phương pháp đưa ra đều bị mất mát thông tin. Nghiên cứu về làm mảnh ta cần chú ý các vấn đề sau : ¾ Không phải tất cả các đối tượng đều có thể làm mảnh. Làm mảnh chỉ hữu dụng với các đối tượng là đường, nghĩa là chúng chỉ Sinh viên Hà Đức Kiên - CT702 Trang 4 Đồ án tôt nghiệp Tìm hiểu phương pháp làm mảnh ảnh thẳng hoặc cong và nó không có tác dụng với các đối tượng có hình dạng đóng trong một vùng. ¾ Làm mảnh thông thường là bước chuẩn bị cho các bước tiếp theo xử lý một đối tượng ảnh. Các bước tiếp theo làm việc trên các thuộc tính cần thiết của xương. 1.2.2. Phân loại các thuật toán tìm xương Có hai phương pháp tìm xương cơ bản : ¾ Phương pháp thứ nhất xử dụng phép biến đổi trục trung vị , trục trung vị được xác định bằng cách nối các điểm trung tâm của khối bao bọc đối tượng , các điểm trung tâm thường được tính bằng hàm khoảng cách cực đại . Phương pháp này là phương pháp tìm xương không dựa trên làm mảnh. ¾ Phương pháp thứ hai bao gồm các thuật toán làm mảnh(thinning) bằng các loại bỏ các điểm cực trị ( điểm biên) mà không làm thay đổi tính liên thông và cấu trúc tôpô của ảnh cho đến khi độ rộng của các đường bằng 1 đơn vị (1 pixel). 1.2.3. Phương pháp thay đổi trục trung vị Có thể người đầu tiên định nghĩa xương là Blum (1976), thông qua việc định nghĩa hàm trục trung vị (MFA). Hàm MFA xử lý tất cả các điểm ảnh trên đường biên như các điểm nguồn của một mặt sóng trước. Mỗi một điểm ảnh lại tác động lên các láng giềng của nó với một thời gian trễ tương ứng với khoảng cách, do vậy chúng cũng trở thành một phần của sóng trước. Sóng truyền qua mỗi điểm chỉ một lần và khi hai sóng gặp nhau, chúng sẽ triệt tiêu nhau, sinh ra một góc. Trục trung vị (MA) là quĩ tích của các góc này, và là Sinh viên Hà Đức Kiên - CT702 Trang 5 Đồ án tôt nghiệp Tìm hiểu phương pháp làm mảnh ảnh mẫu xương của một đối tượng. MAF sử dụng hai thông tin cả về không gian lẫn thời gian, và có thể đảo ngược lại một ảnh gốc. Có một cách để tìm ra trục trung vị là sử dụng đường biên của đối tượng. Đối với bất cứ một điểm p nào đó trên đối tượng, đều có thể bao nó bởi một đường biên. Nếu như có nhiều hơn một điểm biên có khoảng cách ngắn nhất thì p nằm trên trục trung vị. Bộ tất cả các điểm như vậy lập thành trục trung vị của đối tượng. Điều đó phải được thực hiện với độ phân giải cao, hoặc khoảng cách Ơcơlit là không bằng nhau, và như thế các điểm ảnh xương sẽ mất đi. Ta dễ dàng thu được một xấp xỉ của trục trung vị trên một lưới đơn giản sau hai bước: ¾ Bước thứ nhất, tính toán khoảng cách từ mỗi điểm ảnh của đối tượng đến điểm biên gần nhất. Việc này yêu cầu phải tính toán khoảng cách tới tất cả các điểm ảnh đường biên. ¾ Bước thứ hai, khoảng cách ảnh đã được tính toán, và các điểm ảnh có giá trị rộng nhất được xem là nằm trên trục trung vị. Hình2: Trục trung vị Hầu hết các nhà nghiên cứu đều cho rằng thay đổi trục trung vị thường không mang lại một xương chuẩn, và thời gian tính toán quá dài, tuy nhiên, nó là mẫu cơ bản của phần lớn các phương pháp làm mảnh. Sinh viên Hà Đức Kiên - CT702 Trang 6 Đồ án tôt nghiệp Tìm hiểu phương pháp làm mảnh ảnh Phương pháp thay đổi trục trung vị được coi là một phương pháp làm mảnh không lặp , ngoài ra còn có một vài thuật toán duyệt các điểm biên 2 bên mẫu , tính điểm trung tâm của các đường nối giữa các điểm biên đó và xương thu được là tập hợp các điểm trung tâm đó ( line following) hoặc các phương thức sử dụng chuỗi Fourier (Fourier transform) cũng được coi là làm mảnh không lặp. 1.2.4. Phương pháp tìm xương dựa trên làm mảnh Các phương pháp tìm xương dựa trên làm mảnh chính là vấn đề mà đồ án này nghiên cứu. Đó chính là các dạng thuật toán xoá các điểm biên của mẫu một cách có chọn lọc cho đến khi thu được xương. Việc xoá đi hay giữ lại một điểm ảnh (điểm đen) p dựa trên vùng lân cận của p. Như vậy chúng ta xét các điểm ảnh, các thuật toán có thể được phân lớp thành các thuật toán tuần tự hay song song. Đối với thuật toán tuần tự các điểm ảnh được xoá đi theo một trật tự nhất định trong mỗi vòng lặp và giá trị của điểm ảnh p sau mỗi vòng lặp không chỉ phụ thuộc vào giá trị của các láng giềng mà còn phụ thuộc vào các điểm ảnh đã được xét trước đó trong chính vòng lặp đó. Đối với thuật toán làm mảnh song song , các điểm ảnh có thể được xử lý cùng một lúc , giá trị của điểm ảnh chỉ phụ thuộc vào giá trị của các láng giềng. Chính vì thế mà các thuật toán dạng này được xử dụng trên các bộ vi xử lý song song để tăng khả năng tính toán. Tuỳ theo số chu trình con được xử Sinh viên Hà Đức Kiên - CT702 Trang 7 Đồ án tôt nghiệp Tìm hiểu phương pháp làm mảnh ảnh dụng trong thuật toán mà làm mảnh song song được chia ra thành các kiểu như sau : 1, 2 , hoặc 4 chu 1.3 Các khái niệm cơ Xét điểm ảnh p(i,j) và các x4 x3 x2 x5 P x1 x6 x7 x8 trình con. bản trong làm mảnh điểm lân cận Hình3 : Điểm ảnh p và các láng giềng Láng giềng : các điểm ảnh x1, x2,. ... , x8 là 8_láng giềng của p và được biểu thị bởi N(p) và chúng còn được gọi là kề 8 của p. Các điểm ảnh x1, x3, x5, x7 được gọi là 4_láng giềng hay kề 4 của p. Ta sẽ sử dụng xi để chỉ các điểm ảnh và xi là điểm ảnh trắng hoặc đen tương ứng giá trị 0 hoặc 1 của nó. Số các điểm ảnh đen trong N(p) được gọi là b(p). Đường đi : một trật tự của các điểm ảnh y1, y2,. ..., yn được gọi là một 8_đường đi (hoặc 4_đường đi) nếu yi+1 là một trong 8_láng giềng ( hoặc 4_láng giềng ) của yi (i=1, 2,.. ., n-1). Hai điểm được gọi là liên thông với nhau nếu tồn tại đường đi giữa chúng. Một bộ con Q của ảnh P được gọi 8_liên thông ( hay 4_liên thông) nếu mọi cặp điểm x, y trong Q đều tồn tại 8_đường đi (hoặc 4_đường đi) từ x đến y phù hợp với các điểm của Q. Trong trường hợp này, Q được gọi là một 8_thành phần (hoặc 4_thành phần) của P. Sinh viên Hà Đức Kiên - CT702 Trang 8 Đồ án tôt nghiệp Tìm hiểu phương pháp làm mảnh ảnh Điểm biên : các điểm ảnh được xét để xoá là các điểm biên và thường được định nghĩa là có ít nhất 1 trong các láng giềng là trắng. Có 2 loại biên 4 liên kết và 8 liên kết. Hình 4 : các điểm biên liên kết 8 Điểm trong : các điểm đen mà không phải là điểm biên được gọi là điểm trong của ảnh. Điểm cuối : một điểm đen thoả mãn điều kiện b(p)=1 thì được coi là điểm cuối. Điều kiện điểm cuối này được một số tác giả đưa ra với các dạng khác nhau : p có thể được giữ lại khi có 2 hoặc 3 các điểm ảnh đen phối hợp trên một bên của N(p), điều kiện này có thể được áp dụng chỉ sau hai vòng lặp đầu tiên, hoặc rất có thể nó sẽ bị bỏ qua hoàn toàn để tránh các nhánh giả. Phần lớn sự khác nhau giữa các thuật toán là ở điều kiện đảm bảo tính liên thông. Điều kiện này được định nghĩa theo các thuật ngữ số giao, số liên thông, và điểm ảnh đơn. Số giao : có hai định nghĩa về số giao của một điểm ảnh. Sinh viên Hà Đức Kiên - CT702 Trang 9 Đồ án tôt nghiệp Tìm hiểu phương pháp làm mảnh ảnh Rutovitz [5] là người đầu tiên đưa ra định nghĩa về số giao, số giao là số các lần biến đổi từ 1 điểm trắng sang 1 điểm đen và ngược lại khi các điểm ảnh này của N(p) được đặt theo thứ tự ngược chiều kim đông hồ. Do đó, số giao được định nghĩa như sau: XR(p) = 8 ∑ i =1 |xi -1-xi| trong đó x0 = x8 .Việc xoá đi p sẽ không là ảnh hưởng đến 4_liên thông nếu XR(p) = 2. Tuy nhiên, bởi 4_thành phần tách rời có thể được 8_liên thông, các xương thu được sử dụng số giao này có thể có chứa các điểm ảnh xoá được, và các xương đó đôi khi cũng được nói là 8_liên thông một cách chưa hoàn chỉnh (Y. S. Chen [1]). Hilditch [4] định nghĩa số giao XH (p) như số lần nhảy từ điểm trắng sang điểm đen khi các điểm này đang được đặt trong thứ tự, cắt góc giữa kề 4 đen và 4_láng giềng. Do đó: XH (p)= 4 ∑ i =1 bi với bi = ⎧ ⎨ ⎩ 1 nếu x2i - 1 = 0 và (x2i=1 hoặc x2i+1=1) 0 nếu ngược lại khi p có 4_láng giềng đều là đen, trong trường hợp này XH (p) = 0. Có thể thấy rằng, đối với cả hai định nghĩa của số giao, 1 điểm ảnh có cả 8_láng giềng đều là đen thì sẽ có số giao bằng 0, như một điểm ảnh bị cô lập. Nếu XH (p) = 1 thì việc xoá đi p không làm thay đổi tính 8_liên thông của mẫu. Sinh viên Hà Đức Kiên - CT702 Trang 10
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.