Xu hướng công nghệ thiết thực
Hiện tại học máy được sử dụng trong thương mại trên quy mô lớn, trong đó có cá nhân hóa (điều tiết chương trình cho phù hợp với nhu cầu cá nhân của người sử dụng) đối với các đơn chào hàng hoặc nhận dạng các kiểu tiếp xúc mới với khách hàng. Các dữ liệu cho thấy, 68% công ty nhận thức, học máy là xu hướng công nghệ thiết thực.
Học máy dựa trên các thuật toán, tức là tập hợp hữu hạn các chỉ thị hay phương thức được định nghĩa rõ ràng, cần thiết để thu thập kiến thức. Sau mỗi lần hệ thống khởi động dữ liệu mới, các kết quả do nó đưa ra trở nên ngày càng chính xác hơn. Học máy chủ yếu dựa trên 4 thao tác: Phân loại/liệt kê thông tin; dự đoán những sự kiện nhất định trên cơ sở các mô hình đã được nhận dạng; phát hiện/nhận dạng các mô hình chưa được biết đến và sự phụ thuộc giữa chúng; phát hiện sự bất thường và các sự kiện chưa được dự đoán.
Học máy không phải là công nghệ bất biến. Cách thức hoạt động của nó phụ thuộc nhiều vào việc những thuật toán nào được sử dụng và những dữ liệu nào được tăng cường.
Những kiểu học máy cơ bản
Các chuyên gia chỉ ra 4 công nghệ cơ bản của học máy: Học có giám sát (Supervised Learning): Máy tự học trên cơ sở các ví dụ. Điều này giống như các học trò nhận được từ khóa cho bài thử nghiệm và được yêu cầu tìm lời giải. Dữ liệu đầu vào được sử dụng để tìm các mối liên quan nhằm giải quyết một vấn đề cụ thể. Nếu xác lập thành công một mô hình, thì mô hình đó được sử dụng trong các trường hợp tương tự.
Các ví dụ về ứng dụng: Phát hiện sự quá tải, cá nhân hóa tương tác, nhận dạng giọng nói, văn bản, hình ảnh cùng phân khúc khách hàng.
Học nửa giám sát (Semi- Supervised Learning): Trong trường hợp này máy móc nhận được cả dữ liệu đầu vào được gắn nhãn (dự đoán các dữ liệu tương ứng ở đầu ra, các ví dụ cụ thể) cũng như dữ liệu đầu vào không được gắn nhãn (đòi hỏi sắp xếp cho dữ liệu đầu ra, tìm kiếm câu trả lời). Kiểu học máy này được sử dụng trong các trường hợp khi mà một cơ quan, tổ chức có quá nhiều dữ liệu hoặc khi các thông tin khác biệt đến mức không thể sắp xếp câu trả lời cho mỗi thông tin. Hệ thống tự đề xuất câu trả lời và có thể tạo ra những mô hình chung.
Ví dụ về ứng dụng: Nhận dạng giọng nói và hình ảnh, phân loại các trang web.
Học không giám sát (Unsupervised Learning): Máy móc không có “chìa khóa trả lời” và buộc phải tự phân tích dữ liệu, tìm kiếm mô hình và tìm mối tương quan. Kiểu học máy này khiến người ta liên tưởng tới cách hoạt động của bộ não người: Bộ não rút ra kết luận trên cơ sở quan sát tự phát và trực giác. Cùng với sự gia tăng các tập dữ liệu, kết luận đầu ra trở nên ngày càng chính xác.
Ví dụ về ứng dụng: Phân tích gói hàng, phát hiện sự bất thường, nhận dạng đối tượng tương tự.
Học tăng cường (Reinforcement Learning): Máy móc nhận được bộ thao tác, quy định được phép cho trước. Hoạt động trong khuôn khổ đó, máy móc tiến hành phân tích và quan sát kết quả các thao tác. Có thể so sánh kiểu học máy này với học chơi bóng rổ. Các quy định về bước chân, lỗi hay bóng ra ngoài sân... là không thay đổi. Ngược lại, cách mà một đội bóng giành điểm (người chơi ném bóng từ khoảng cách xa, chạy đến gần rổ hay chuyền bóng cho người chơi khác) phụ thuộc vào quyết định tức thời của người chơi.
Ví dụ về ứng dụng: Hoa tiêu (lựa chọn hành trình dựa trên thông tin về sự gia tăng mật độ giao thông trên đường), trò chơi điện tử, robot học.
Máy móc không học được điều gì?
Mặc dù khả năng hoàn thiện học máy là rất lớn, nhưng công nghệ này có một số hạn chế. Máy móc không có khả năng tư duy sáng tạo và không đưa ra được các dự đoán, giả định nếu thiếu dữ liệu thích hợp. Ngoài ra, máy móc không thu nhận các kích thích mới, chưa được biết đến. Mỗi một sự thay đổi dữ liệu gây ảnh hưởng đến công việc của máy móc. Điều đó có nghĩa là có thể gây ảnh hưởng (có chủ đích hoặc do nhầm lẫn) đối với các kết quả được thể hiện, thông qua việc thay đổi các thông tin cung cấp cho hệ thống.