Nghiên cứu mới giúp robot có được "lẽ thường", chỉ xem video một lần cũng học được cách làm việc
Một cuộc cách mạng lớn trong lĩnh vực đào tạo robot đang diễn ra, với “cương lĩnh” được viết bởi các nhà nghiên cứu tại Đại học Cornell. Nhóm chuyên gia vừa phát triển một khung làm việc tích hợp AI mới mang tên RHyME, mở ra khả năng robot học kỹ năng chỉ qua một lần quan sát.
Theo lời Kushal Kedia, nghiên cứu sinh tiến sĩ ngành khoa học máy tính tại Cornell và là tác giả chính của nghiên cứu, một trong những tác vụ phiền toái nhất khi làm việc với robot là thu thập vô số dữ liệu về việc robot thực hiện các nhiệm vụ khác nhau. “Con người không học cách làm việc như vậy. Chúng ta học bằng cách quan sát người khác”, Kedia nói.
Robot phải học một lượng dữ liệu khổng lồ để có thể thực hiện các thao tác giống người - Hình minh họa.
Suốt nhiều thập kỷ, robot đã học kỹ năng của con người thông qua một phương pháp có tên “học bắt chước - imitation learning”. Để robot tái diễn thành công những động tác này, các cá nhân biểu diễn trong video minh họa phải cử động chính xác, mượt mà và đồng nhất. Những sai lầm dù là nhỏ nhất cũng có thể gây ra thất bại ê chề.
Tuy nhiên, cách thức huấn luyện này lại vướng phải một rào cản lớn, xuất phát từ chính sự uyển chuyển, phức tạp và khó đoán trong động tác của con người, khiến việc bắt chước hiệu quả trở nên vô cùng khó khăn cho robot. Hơn nữa, lượng dữ liệu khổng lồ và quy trình lập trình chi tiết khiến “học bắt chước” tốn chi phí và thời gian.
RHyME (Retrieval for Hybrid Imitation under Mismatched Execution, tạm dịch là Tái tạo học bắt chước hỗn hợp trong điều kiện sai lệch thao tác) được thiết kế để vượt qua chính vấn đề hóc búa này. Thay vì cố gắng sao chép từng bước hành động của con người, RHyME trang bị cho robot một hệ thống ký ức mới, có thể coi như một dạng “lẽ thường” phiên bản kỹ thuật số.
Khi robot đối mặt với một nhiệm vụ mà nó đã từng thấy con người thực hiện, ví dụ như cầm cái đĩa bẩn lên và đặt vào bồn rửa, nó có thể gợi lại video trong cơ sở dữ liệu của mình và thực hiện các thao tác có trong đó. Giống như cách chúng ta nhớ các thao tác đã học và tái hiện nó vậy.
Cánh tay robot học được thao tác sau một lần quan sát - Video: Kushal Kedia/Đại học Cornell.
Quá trình “gợi nhớ - làm lại” này giúp robot thực hiện được tác vụ mà không nhất thiết phải sao chép 100% những gì đã được thể hiện trong video. Nói một cách đơn giản, khung làm việc RHyME cho phép robot tổng hợp và tự tạo ra các thao tác mới dựa trên việc kết hợp những dữ liệu đã học
Thử nghiệm trong phòng thí nghiệm cho thấy robot được huấn luyện bằng RHyME đạt tỷ lệ thành công cao hơn 50% so với các phương pháp huấn luyện truyền thống. Đặc biệt, RHyME chỉ sử dụng lượng dữ liệu tương đương video dài 30 phút, tiết kiệm được cả chi phí và thời gian so với công tác huấn luyện truyền thống.
Thời điểm robot rửa bát có thể thay thế máy rửa bát vẫn còn xa, nhưng nỗ lực của các nhà nghiên cứu Đại học Cornell đang khiến tương lai ấy tới gần hơn một chút. Hiện nhóm đang tinh chỉnh RHyME và tìm cách dạy robot những tác vụ phức tạp hơn nữa. Việc robot có thể quan sát và thích nghi một cách chủ động sẽ là yếu tố sống còn, giúp chúng trở nên thực sự hữu ích trong môi trường không hoàn hảo, nhiều biến số như đời sống con người.
Nhóm nghiên cứu đã sẵn sàng trình bày phát hiện này tại Hội nghị quốc tế IEEE về Robot và Tự động hóa tổ chức tại Atlanta, và đã tải nghiên cứu lên đường link này để các bên tham khảo.
* Mời quý độc giả theo dõi các chương trình đã phát sóng của Đài Truyền hình Việt Nam trên TV Online và VTVGo!