Vừa tiếp tục thử nghiệm sản phẩm LAM thế hệ mới của Rabbit R1, tôi tự hỏi liệu đây có phải là cam kết mà công ty đã đưa ra không?
Các Thỏ R1 đã trải qua một chặng đường dài và đầy biến động trong suốt năm nay. Từ sự ra đời mạnh mẽ tại Triển lãm CES 2024 đến việc nhận được nhiều đánh giá tiêu cực sau khi không thực hiện được những hứa hẹn (kể cả từ chính chúng tôi), đến những lỗi trong quá trình thử nghiệm.
Tuy nhiên, nhóm Rabbit đã không ngừng làm việc để cải thiện sản phẩm của mình. 16 bản cập nhật qua mạng đã được phát hành để mang đến các tính năng mới, sửa lỗi và tăng tốc độ của các tính năng đã có. Mặc dù vậy, hứa hẹn về AI đại lý Mô hình hành động lớn (LAM) vẫn chưa trở thành hiện thực.
Lần này, Rabbit đã trở lại với LAM thế hệ tiếp theo, ra mắt bản beta với tên gọi LAM playground. Generic Website Agent, một phần của sân chơi mới này, cho phép người dùng thực hiện nhiều tác vụ thông qua lời nhắc văn bản hoặc yêu cầu bằng ngôn ngữ tự nhiên cho Rabbit R1 của họ.
Một điểm mạnh của sân chơi mới này là Rabbit đã thực sự đưa ra những gì đã hứa. Từ việc truy cập trang web đến chơi trò chơi từ ngữ, người dùng có thể theo dõi LAM thực hiện yêu cầu của họ theo thời gian thực. Điều đáng chú ý là LAM cũng đã được đào tạo trên hệ điều hành Linux.
Tuy nhiên, bản beta vẫn còn nhiều vấn đề cần được cải thiện như tốc độ chậm và sự xuất hiện của lỗi. Tuy nhiên, sự minh bạch về những vấn đề này đem lại niềm tin cho người dùng về sự phát triển của Rabbit.
Cuối cùng, mặc dù vấn đề vẫn còn tồn tại, sự tiếp cận thân thiện với người dùng của Rabbit và khả năng tương tác trực tiếp đưa ra hy vọng về tương lai sáng láng của sản phẩm này.
Các Thỏ R1 đã có một hành trình khá dài qua những thăng trầm trong suốt năm nay — khởi đầu mạnh mẽ trên một làn sóng cường điệu tại Triển lãm CES 2024và cuối cùng là ra mắt với rất nhiều đánh giá tiêu cực vì không thực hiện được những gì đã hứa (kể cả từ chúng tôi). Trên hết, chỉ có một vấn đề chính trong quá trình thử nghiệm của chúng tôi là nhiều tính năng mà chúng tôi được thông báo không hoạt động như mong đợi (có rất nhiều lỗi).
Công bằng mà nói, nhóm Rabbit đã làm việc chăm chỉ trong hậu trường và cung cấp 16 bản cập nhật qua mạng để mang đến các tính năng mới, sửa lỗi và tăng tốc các tính năng đã có từ trước. Nhưng điều thực sự đau lòng khi ra mắt là lời hứa về AI đại lý Mô hình hành động lớn (LAM) này chưa bao giờ thực sự trở thành hiện thực.
Như Nhà sáng lập và Giám đốc điều hành Jesse Lyu đã nói trong cuộc phỏng vấn kéo dài hai giờ với tôi (có rất nhiều điều để chia sẻ vào cuối tuần này), hệ thống hiện có dựa trên một tập hợp nhỏ hơn các “bản ghi âm từ mọi người”. Điều này có nghĩa là nó có thể thực hiện một số việc, nhưng phạm vi khá hạn chế so với lời hứa lớn được đưa ra lúc đầu.
Vâng, Rabbit đã trở lại với LAM thế hệ tiếp theo — ra mắt bản beta với tên gọi LAM playground vào ngày 1 tháng 10 — và tôi đã có cơ hội dùng thử và xem nó như thế nào. Tôi không thể cho bạn thấy nó trông như thế nào, nhưng tôi có thể nói về nó.
Sân chơi Rabbit LAM mới hoạt động như thế nào
Đây là thứ mà Rabbit gọi là Generic Website Agent — thứ có khả năng thực hiện nhiều việc cho bạn, thông qua lời nhắc văn bản trong Rabbit Hole hoặc (điều mà tất cả mọi người đang chờ đợi) đưa ra yêu cầu bằng ngôn ngữ tự nhiên cho Rabbit R1 của bạn.
Vì vậy, để bắt đầu, tất cả đều hoạt động thông qua hệ thống giống như máy ảo mà người dùng Rabbit có thể đã quen tương tác khi đăng nhập vào tài khoản tương ứng của họ. Từ đây, nếu bạn đưa ra yêu cầu về thứ gì đó trên internet — ví dụ của Jesse là thêm 12 lon Diet Coke vào giỏ hàng Amazon của anh ấy — LAM sẽ bắt đầu hoạt động.
Bạn có thể xem điều đó xảy ra theo thời gian thực, khi mô hình tầm nhìn quan sát những gì đang diễn ra bằng cách chụp ảnh màn hình, phân tích và chỉ đạo một tập lệnh để tương tác theo một cách cụ thể dựa trên sự hiểu biết của nó về những gì đang diễn ra trong cửa sổ trình duyệt. Điều này bao gồm đóng lời nhắc cookie và có thể phục hồi sau những thay đổi về giao diện người dùng trong tương lai.
Những gì tôi thích
Vâng, thực sự chỉ có một điều lớn mà tôi thích về nó, đó là Rabbit đã thực hiện những gì đã hứa cách đây nhiều tháng. Trong các nhiệm vụ tôi thấy và ném vào sân chơi LAM — từ việc truy cập trang web bất động sản và tìm tất cả các ngôi nhà dưới 500.000 bảng Anh ở Nam London, đến việc chơi một Từ ngữ– trò chơi tương tự trong ba vòng, bạn sẽ theo dõi nó thực hiện yêu cầu của mình theo thời gian thực.
Không ai nói về việc mua những thứ như đã được tuyên bố trên sân khấu tại CES, nhưng điều đó là có thể nếu bạn đưa cho Rabbit R1 những hướng dẫn đúng và tự đăng nhập vào tài khoản tương ứng của trang web bán lẻ. Một điều lớn mà chúng tôi đã nhận được câu trả lời là cách tiếp cận của agentic đối với du lịch — cung cấp cho bạn một kế hoạch và thực sự hành động để đặt chuyến bay và trải nghiệm.
“Chúng tôi không biết rằng ở Hoa Kỳ, chúng tôi cần giấy phép đại lý du lịch để có thể xử lý việc đặt chỗ. Đó là lỗi của chúng tôi,” Jesse nhanh chóng bình luận khi tôi hỏi anh ấy về tính năng này. Nhưng bây giờ, với LAM được xây dựng theo cách của nó — một cách mà bạn có thể thấy nó hoạt động và có khả năng tương tác trực tiếp và ngắt quãng những gì nó đang làm, điều này giải thoát họ khỏi việc cần giấy phép nói trên.
Một tính năng lớn khác của sân chơi này là LAM cũng đã được đào tạo trên một hệ điều hành máy tính để bàn — cụ thể là Linux. Tất cả vẫn còn rất sớm, nhưng những gì Lyu đã cố gắng chỉ cho tôi là một yêu cầu mở phiên bản tương đương của hệ điều hành này với Microsoft Word và viết một bài thơ. Điều này có nghĩa là với sự phát triển hơn nữa, về cơ bản nó có thể tiếp quản và tạo ra công việc mà bạn có thể không bận tâm đến, chẳng hạn như tạo một bộ bài thuyết trình.
Việc theo dõi LAM một lần nữa thực hiện công việc này ở chế độ nền là dấu hiệu cho thấy Rabbit đang đi đúng hướng. Công cụ đã được xây dựng cơ bản ở đây và cho thấy hoạt động với tôi là thứ đã được nói đến trong suốt nhiều tháng qua. Đây là nỗ lực bắt kịp khá lớn, nhưng đó là dấu hiệu đầu tiên của tác nhân AI mà tôi đang tìm kiếm. Như câu ngạn ngữ cũ đã nói, thà muộn còn hơn không.
Phòng để cải thiện
Hiện tại đã có sự minh bạch rõ ràng về các vấn đề của bản beta này (nhấn mạnh vào bản beta) vì tôi đã tình cờ gặp phải một loạt vấn đề trong quá trình chạy. Điều đầu tiên tôi nhận thấy là nó chậm. Trung bình, cứ 5-6 giây lại có một hướng dẫn mới được đưa ra sau khi chụp ảnh màn hình và phân tích.
Và khi tôi nói đến nhiệm vụ, ý tôi là đi xuống từng hướng dẫn đơn lẻ — mở một trang web, sau đó chấp nhận lời nhắc cookie, nhấp vào hộp văn bản, nhập văn bản vào hộp văn bản và nhấn enter. Tất cả những điều này đều mất khoảng thời gian đó. Rabbit biết rằng có rất nhiều việc phải làm ở đây để làm cho nó nhanh hơn và giảm độ trễ.
Thứ hai, như bạn mong đợi từ bất kỳ bản beta nào, đều có lỗi. Ví dụ, với bài thơ đó, LAM đã mở một tài liệu word để nhập, mô hình đã ảo giác và cung cấp cho chúng tôi khoảng bốn trang chữ cái và số bị bóp méo. Một lần nữa, Lyu đã nói rõ những điều này sẽ xảy ra và bản beta test là để tìm ra những lỗi này.
Cuối cùng, hãy cùng nhìn vào tương lai ở đây trong một giây. Một trở ngại mà mọi công ty AI đều phải đối mặt là liệu các công ty mà mô hình của họ tương tác có thực sự đồng ý hợp tác hay không.
Trong trường hợp của Rabbit, tính thân thiện với người dùng của một tác nhân AI chung hoạt động trên toàn bộ web có thể rất lớn, nhưng nó cũng phụ thuộc vào các trang web này cho phép bot này truy cập và điều hướng trang web. Điều gì xảy ra nếu những người chơi lớn nói “không?”
Và Lyu nhận thức được nhiệm vụ trước mắt của mình trong việc bảo mật các quyền này. Anh ấy đã nói về việc sử dụng Linux cho phần hệ điều hành của LAM và cách nó có thể hoạt động với Windows hoặc macOS, nhưng điều đó đòi hỏi phải làm việc trên một thỏa thuận cấp phép mở rộng để thực hiện.
Giống như MởAITôi có thể tưởng tượng ra một kịch bản mà tiền phải đổi chủ để được cấp phép vào thăm một số trang web của các thương hiệu lớn. Đây là một ngọn núi thú vị mà Rabbit chưa thể leo lên, nhưng chắc chắn sẽ sớm xuất hiện.
Đừng gọi đó là sự trở lại?
Đã lâu kể từ khi ra mắt vào tháng 5, nhưng từ những gì tôi nghe và thử nghiệm, tôi khá tự tin rằng Rabbit đang đi đúng hướng để phát triển thành LAM mà chúng ta đã hình dung sau khi Jesse gây tiếng vang với thông báo tại CES.
Liệu nó có rửa trôi được vị đắng trong miệng những người cảm thấy bị bỏ rơi bởi kỳ vọng so với thực tế khi mua R1 mà không có những tính năng được tuyên bố này ngay từ đầu không? Điều đó vẫn còn phải chờ xem. Nhưng việc thực hiện một cách tiếp cận hành động hơn là lời nói đối với phản ứng ban đầu chắc chắn là một cách tiếp cận thông minh hơn, và tôi rất muốn thấy điều này tăng tốc và phát triển thành một thứ gì đó đa nền tảng và thực sự khá thông minh.
Những thứ khác mà Rabbit mang lại là tương tác ngôn ngữ tự nhiên hơn với R1 (điều này đã được công khai gần đây nhất) và hiện tại đang chạy thử nghiệm Alpha của Teach Mode. Theo thời gian sử dụng của tôi, nó gần giống như một phiên bản mượt mà hơn của ứng dụng Apple’s Shortcuts — thay vào đó dựa vào lời nhắc ngôn ngữ tự nhiên thay vì phải nhập thủ công từng bước của quy trình.
Câu hỏi lớn nhất mà Rabbit vẫn chưa trả lời thỏa đáng là liệu phiên bản thông minh hơn của tiện ích AI có hợp lý trong thời đại điện thoại AI mạnh mẽ như thế này hay không. iPhone 16, Galaxy S24 Và Điểm ảnh 9.
Lyu nói với tôi rằng tầm nhìn tương lai của anh ấy mở rộng ra ngoài những chiếc điện thoại này bằng cách có khả năng hoạt động trên nhiều nền tảng — đưa AI đại lý vào để thực hiện bất kỳ yêu cầu nào bất kể hệ điều hành nào cần thực hiện, thay vì chỉ giới hạn ở Android hoặc iOS như những chiếc điện thoại này. Nhưng liệu người dùng thông thường có thực sự chăm sóc về điều này? Đó là vấn đề lớn, cần phải tranh luận — đặc biệt là vì nhiều khả năng là Rabbit sẽ là bản beta đầu tiên, nhưng bạn có thể thấy điện thoại sẽ sớm có bộ tính năng tương tự.
Theo Lyu, còn rất nhiều việc phải làm để có thể phát hành công khai sản phẩm này trong khoảng thời gian sáu tháng, nhưng dựa trên việc đạt được bản cập nhật OTA hàng tuần để khắc phục lỗi và cải thiện trải nghiệm, thì khả năng thành công là hoàn toàn có thể.
Thêm từ Tom’s Guide
Viễn Đông Mobile là cửa hàng chuyên kinh doanh các sản phẩm điện tử phục vụ nhu cầu chơi game, bao gồm:
- Gaming phone: Điện thoại cấu hình mạnh, tối ưu cho việc chơi game.
- Máy tính bảng chuyên gaming: Màn hình lớn, hiệu năng cao, trải nghiệm game tốt hơn.
- Phụ kiện cao cấp: Tai nghe, bàn phím, chuột,… hỗ trợ game thủ.
Thông tin liên hệ:
- Địa chỉ: 211 đường 3/2, phường 10, quận 10, TP.HCM
- Điện thoại: 0777600020
- Email: [email protected]

Bản đồ chỉ đường