'Chìa khóa công nghệ' của xe tự hành

GD&TĐ - Yêu cầu không thể thiếu với xe tự hành là phải tự nhận diện được các đối tượng tham gia giao thông và không gian làn đường…

'Chìa khóa công nghệ' của xe tự hành

Kỹ thuật phân đoạn ảnh là nền tảng của tính năng này.

Gia tăng độ an toàn cho xe tự lái

Công nghệ xe tự lái là một lĩnh vực mới và đang được các doanh nghiệp Việt Nam đón đầu phát triển trên cơ sở của cuộc Cách mạng công nghiệp lần thứ 4.

Các mẫu xe sở hữu công nghệ thông minh, đáp ứng mục tiêu nâng cao chất lượng sống của người dân trong tương lai đô thị thông minh, thân thiện với môi trường...

Lợi ích của xe tự lái là có thể thay thế con người làm chủ vô lăng đến 90%. Khả năng này ngày càng được cải thiện để gia tăng độ an toàn và hạn chế một số rủi ro nhất định.

Trong quá trình xử lý của xe tự hành, ứng dụng kỹ thuật phân đoạn ảnh cung cấp các thông tin về không gian làn đường, phát hiện các đối tượng tham gia giao thông để hỗ trợ cho quá trình tự lái.

Quá trình xử lý ảnh là nâng cao chất lượng ảnh và xử lý số liệu cung cấp cho các quá trình khác, trong đó có việc ứng dụng thị giác vào điều khiển. Đã có rất nhiều công trình nghiên cứu tại các quốc gia từ năm 1920 về xử lý ảnh, trong đó có kỹ thuật phân đoạn ảnh.

Kỹ thuật phân đoạn ảnh là việc phân loại ảnh thành các nhóm khác nhau. Phân đoạn ảnh ứng dụng đối với xe tự lái sử dụng thuật toán phân cụm K-means, là thuật toán dựa trên học không giám sát (Unsupervised learning) để tách các đối tượng theo nhóm.

Để nhận dạng ảnh trở nên dễ dàng thì ảnh cần phải tách thành các đối tượng riêng biệt. Nếu phân đoạn ảnh không tốt sẽ dẫn đến sai lầm trong quá trình nhận dạng. Phân đoạn ảnh nhằm phân tích ảnh thành những thành phần có cùng tính chất dựa theo biên hay các vùng liên thông.

Một cách tổng quát, phân đoạn ảnh được định nghĩa như việc chia hình ảnh thành các đối tượng độc lập với nhau dựa trên các đặc tính của ảnh như mức xám hay kết cấu của ảnh.

Dựa vào đặc tính vật lý của vùng ảnh, có thể có nhiều kỹ thuật phân đoạn ảnh như: Phương pháp ngưỡng, tách biên, phương pháp thống kê MLC (Maximum likehood classifier), phương pháp dựa trên mạng

nơ-ron, phương pháp dựa trên các thuật toán phân cụm dữ liệu. Thông thường, các kỹ thuật dựa trên phân cụm trả về kết quả là nhiều hơn 2 cụm, trong khi đó các phương pháp dựa trên ngưỡng trả về là 2 cụm. Thuật toán phân cụm là phương pháp phổ biến được sử dụng trong kỹ thuật phân đoạn ảnh.

Ứng dụng phân đoạn ảnh đối với xe tự hành

Phân cụm là kỹ thuật rất quan trọng trong khai phá dữ liệu, nó thuộc lớp các phương pháp học không giám sát trong học máy (Machine learning). Thuật toán phân cụm K-means được giới thiệu năm 1957 bởi Lloyd K-means và là phương pháp phổ biến nhất cho việc phân cụm.

Tư tưởng chính của thuật toán K-Means là tìm cách phân nhóm các đối tượng đã cho vào k cụm (k là số các cụm được xác định trước, k nguyên dương) sao cho tổng bình phương khoảng cách giữa các đối tượng đến tâm nhóm (centroid) là nhỏ nhất.

Về cơ bản, thuật toán phân cụm K-means sử dụng phương pháp tạo và cập nhật trung tâm để phân nhóm các điểm dữ liệu cho trước vào các nhóm khác nhau.

Ô tô tự lái, kết hợp tính năng tự động hóa phương tiện, có khả năng cảm nhận môi trường và di chuyển an toàn mà không cần hoặc không có sự tham gia của con người.

Trong quá trình vận hành, phân đoạn ảnh cung cấp các thông tin về không gian ở trên đường, phát hiện các đối tượng và các biển báo giao thông, xác định làn đường, các xe ô tô, người đi bộ… để hỗ trợ cho ô tô tự lái.

Qua thực nghiệm cho thấy rằng, kết quả của việc phân đoạn tốt và ổn định phụ thuộc rất nhiều vào tham số k tâm cụm được khởi tạo. Trong trường hợp k tâm cụm khởi tạo này có độ lệch thực tế lớn thì kết quả của việc phân cụm là thấp.

Để khắc phục điểm yếu này, có thể thực hiện giải pháp tính toán trước khi thực hiện phân cụm. Theo đó, gộp nhóm các điểm ảnh có cùng màu sắc, sắp xếp chọn ra k nhóm màu có số lượng điểm ảnh nhỏ nhất và khởi tạo k tâm cụm là một trong các điểm ảnh của k nhóm này.

Nhược điểm của phương pháp này là đối với ảnh đầu vào có kích thước lớn và khoảng các giá trị màu sắc rộng thì phải chịu khá nhiều chi phí tính toán, sắp xếp để tính được k nhóm màu có số lượng điểm ảnh lớn nhất. Tuy nhiên, kết quả phân cụm của phương pháp bảo đảm tốt hơn việc khởi tạo ngẫu nhiên.

Tin tiêu điểm

Đừng bỏ lỡ

Sinh viên quốc tế chịu tác động mạnh mẽ từ chính sách rút ngắn thị thực.

Du học sinh Mỹ bị rút ngắn thời hạn lưu trú

GD&TĐ - Chính quyền Tổng thống Donald Trump có kế hoạch chấm dứt chính sách “thời hạn lưu trú”, cho phép sinh viên quốc tế ở lại Mỹ miễn là họ đang theo học tại một cơ sở giáo dục được công nhận.

Tại ngày hội lựa chọn nguyện vọng năm 2025, nhiều thí sinh quan tâm đến tuyển sinh ngành sư phạm. Ảnh minh họa: Nam Trần

Tuyển sinh sư phạm: Từ 'chạm đáy' đến 'kịch trần'

GD&TĐ - Với hàng loạt chính sách tác động, sư phạm ngày càng trở thành ngành học danh giá, có mức điểm chuẩn cao top đầu, phá bỏ hẳn tình trạng “chuột chạy cùng sào mới vào sư phạm” từng là nỗi trăn trở đau đáu một thời.