Những thách thức kỹ thuật và tương lai của DePIN và trí thông minh hiện thân

avatar
Coinspire
1tháng trước
Bài viết có khoảng 5773từ,đọc toàn bộ bài viết mất khoảng 8 phút
Bài viết này sẽ thảo luận về tương lai của robot DePIN và xem liệu chúng ta có sắp có khoảnh khắc ChatGPT cho robot DePIN hay không.

Những thách thức kỹ thuật và tương lai của DePIN và trí thông minh hiện thân

Vào ngày 27 tháng 2, Messari đã tổ chức một podcast về “Xây dựng AI vật lý phi tập trung” với Michael Cho, đồng sáng lập FrodoBot Lab. Họ đã thảo luận về những thách thức và cơ hội của Mạng cơ sở hạ tầng vật lý phi tập trung (DePIN) trong lĩnh vực robot. Mặc dù lĩnh vực này vẫn còn trong giai đoạn sơ khai, nhưng nó có tiềm năng rất lớn và có thể thay đổi hoàn toàn cách thức hoạt động của robot AI trong thế giới thực. Tuy nhiên, không giống như AI truyền thống dựa vào lượng lớn dữ liệu Internet, công nghệ AI của robot DePIN phải đối mặt với những vấn đề phức tạp hơn, chẳng hạn như thu thập dữ liệu, hạn chế về phần cứng, tình trạng tắc nghẽn khi đánh giá và tính bền vững của các mô hình kinh tế.

Trong bài viết hôm nay, chúng tôi sẽ phân tích những điểm chính từ cuộc thảo luận này và xem robot DePIN gặp phải những vấn đề gì, những trở ngại chính trong việc mở rộng quy mô robot phi tập trung là gì và tại sao DePIN có lợi thế hơn các phương pháp tập trung. Cuối cùng, chúng ta sẽ khám phá tương lai của robot DePIN và xem liệu chúng ta có sắp có khoảnh khắc ChatGPT cho robot DePIN hay không.

Điểm nghẽn của robot thông minh DePIN nằm ở đâu?

Khi Michael Cho bắt đầu làm việc trên FrodoBot, vấn đề đau đầu nhất của anh là chi phí cho công nghệ robot. Mức giá cao ngất ngưởng của các robot thương mại trên thị trường khiến việc quảng bá các ứng dụng AI trong thế giới thực trở nên khó khăn. Giải pháp ban đầu của ông: chế tạo một robot tự động giá rẻ chỉ 500 đô la, nhằm mục đích giảm giá thành xuống mức thấp hơn hầu hết các dự án hiện có.

Nhưng khi anh và nhóm của mình đi sâu hơn vào nghiên cứu và phát triển, Michael nhận ra rằng chi phí không phải là rào cản thực sự. Những thách thức của mạng lưới cơ sở hạ tầng vật lý phi tập trung (DePIN) trong ngành robot phức tạp hơn nhiều so với câu hỏi “nó có tốn kém không?” Khi FrodoBotLab tiếp tục phát triển, một số điểm nghẽn trong công nghệ robot DePIN đã dần xuất hiện. Để đạt được triển khai trên quy mô lớn, cần phải khắc phục những điểm nghẽn sau.

Nút thắt 1: Dữ liệu

Không giống như các mô hình AI trực tuyến lớn được đào tạo trên lượng lớn dữ liệu Internet, AI tích hợp cần tương tác với thế giới thực để phát triển trí thông minh. Vấn đề là thế giới hiện nay chưa có cơ sở hạ tầng quy mô lớn này và chưa có sự thống nhất về cách thu thập dữ liệu này. Việc thu thập dữ liệu cho AI tích hợp có thể được phân loại thành ba loại chính:

▎Thể loại đầu tiên là dữ liệu vận hành của con người , đây là dữ liệu được tạo ra khi con người điều khiển robot theo cách thủ công. Dữ liệu này có chất lượng cao và ghi lại luồng video và nhãn hành động — những gì con người nhìn thấy và phản ứng của họ. Đây là cách hiệu quả nhất để đào tạo AI bắt chước hành vi của con người, nhưng nhược điểm là tốn kém và đòi hỏi nhiều nhân công.

▎Loại thứ hai là dữ liệu tổng hợp (dữ liệu mô phỏng), hữu ích cho việc huấn luyện robot di chuyển trên địa hình phức tạp, chẳng hạn như huấn luyện robot đi trên địa hình gồ ghề và rất hữu ích cho một số lĩnh vực đặc biệt. Nhưng đối với những nhiệm vụ có tính thay đổi lớn, chẳng hạn như nấu ăn, thì môi trường mô phỏng lại không hiệu quả lắm. Hãy tưởng tượng việc huấn luyện một con rô-bốt chiên trứng: những thay đổi nhỏ về loại chảo, nhiệt độ dầu và điều kiện phòng sẽ ảnh hưởng đến kết quả và môi trường ảo sẽ khó có thể bao quát được mọi tình huống.

▎Thể loại thứ ba là học qua video , tức là để mô hình AI học bằng cách quan sát các video về thế giới thực. Mặc dù cách tiếp cận này có tiềm năng, nhưng nó lại thiếu phản hồi tương tác trực tiếp, vật lý thực sự cần thiết cho trí thông minh.

Nút thắt 2: Mức độ tự chủ

Michael cho biết khi lần đầu thử nghiệm FrodoBot ngoài đời thực, anh chủ yếu sử dụng robot này để giao hàng chặng cuối. Xét theo dữ liệu, kết quả thực sự khá tốt - robot đã hoàn thành thành công 90% nhiệm vụ giao hàng. Nhưng trong thực tế, tỷ lệ thất bại 10% là không thể chấp nhận được. Một robot chỉ giao hàng được một trong mười lần thì không thể được thương mại hóa. Giống như công nghệ lái xe tự động, xe không người lái có thể đạt thành tích 10.000 lần lái thành công, nhưng chỉ cần một lần thất bại cũng đủ làm mất lòng tin của người tiêu dùng thương mại.

Do đó, để robot thực sự hữu ích, tỷ lệ thành công phải đạt tới 99,99% hoặc thậm chí cao hơn. Nhưng vấn đề là mỗi 0,001% cải thiện về độ chính xác đòi hỏi nhiều thời gian và công sức hơn gấp bội. Nhiều người đánh giá thấp mức độ khó khăn của bước cuối cùng này.

Michael nhớ lại khi anh ngồi trong nguyên mẫu xe tự lái của Google vào năm 2015, anh cảm thấy rằng công nghệ lái xe hoàn toàn tự động đã gần kề. Mười năm sau, chúng ta vẫn đang thảo luận về thời điểm đạt được mức độ tự chủ hoàn toàn Cấp độ 5. Sự tiến bộ của ngành robot không phải là tuyến tính mà là theo cấp số nhân—với mỗi bước tiến, độ khó tăng lên đáng kể. Độ chính xác 1% cuối cùng này có thể mất nhiều năm hoặc thậm chí nhiều thập kỷ mới đạt được.

Nút thắt 3: Phần cứng: AI không thể tự giải quyết được vấn đề về robot

Nói cách khác, ngay cả khi các mô hình AI rất mạnh mẽ, phần cứng robot hiện tại vẫn chưa sẵn sàng để đạt được khả năng tự chủ thực sự. Ví dụ, vấn đề dễ bị bỏ qua nhất trong phần cứng là thiếu cảm biến xúc giác - công nghệ tốt nhất hiện nay, chẳng hạn như nghiên cứu của Meta AI, vẫn còn kém xa độ nhạy của đầu ngón tay con người. Trong khi con người dựa vào thị giác và xúc giác để tương tác với thế giới, robot lại có ít hiểu biết về kết cấu, độ bám và phản hồi áp suất.

Ngoài ra còn có vấn đề về che khuất - khi một vật thể bị chặn một phần, robot sẽ khó có thể nhận ra và tương tác với vật thể đó. Ngay cả khi con người không thể nhìn thấy toàn bộ hình ảnh của một vật thể, họ vẫn có thể hiểu được nó một cách trực quan.

Ngoài các vấn đề về nhận thức, bản thân bộ truyền động của robot cũng có một số lỗi. Hầu hết các robot hình người đều đặt bộ truyền động trực tiếp vào các khớp, khiến chúng cồng kềnh và có khả năng nguy hiểm. Ngược lại, cấu trúc gân của con người cho phép chuyển động mượt mà và an toàn hơn. Đây là lý do tại sao các robot hình người hiện tại có vẻ cứng nhắc và thiếu linh hoạt. Các công ty như Apptronik đang phát triển nhiều thiết kế bộ truyền động lấy cảm hứng từ sinh học hơn, nhưng những cải tiến này sẽ cần thời gian để hoàn thiện.

Nút thắt 4: Tại sao việc mở rộng phần cứng lại khó khăn đến vậy?

Không giống như các mô hình AI truyền thống chỉ dựa vào sức mạnh tính toán, việc triển khai công nghệ robot thông minh đòi hỏi phải triển khai các thiết bị vật lý trong thế giới thực. Điều này đặt ra thách thức rất lớn về vốn. Việc chế tạo robot rất tốn kém và chỉ những công ty giàu có nhất mới có đủ khả năng chi trả cho các thí nghiệm trên quy mô lớn. Ngay cả những robot hình người hiệu quả nhất hiện nay cũng có giá hàng chục nghìn đô la, khiến việc áp dụng rộng rãi trở nên không thực tế.

Nút thắt 5: Hiệu quả đánh giá

Đây là một nút thắt vô hình. Hãy nghĩ về điều này, các mô hình AI trực tuyến lớn như ChatGPT có thể kiểm tra chức năng của chúng gần như ngay lập tức - sau khi một mô hình ngôn ngữ mới được phát hành, các nhà nghiên cứu hoặc người dùng thông thường trên toàn thế giới về cơ bản có thể rút ra kết luận về hiệu suất của nó trong vòng vài giờ. Nhưng việc đánh giá AI vật lý đòi hỏi phải triển khai trong thế giới thực, mất nhiều thời gian.

Phần mềm tự lái hoàn toàn (FSD) của Tesla là một ví dụ điển hình. Nếu một chiếc Tesla chạy được 1 triệu dặm mà không gặp tai nạn, điều đó có nghĩa là nó thực sự đạt được khả năng tự hành Cấp độ 5 không? Thế còn 10 triệu dặm thì sao? Vấn đề với trí thông minh của robot là cách duy nhất để xác thực nó là xem nó thất bại ở đâu, nghĩa là phải triển khai trên diện rộng và thời gian thực trong thời gian dài.

Nút thắt 6: Nguồn nhân lực

Một thách thức khác bị đánh giá thấp là sức lao động của con người vẫn không thể thiếu trong quá trình phát triển AI của robot. Chỉ có AI thôi là không đủ. Robot cần có người vận hành cung cấp dữ liệu đào tạo; nhóm bảo trì để robot hoạt động; và các nhà nghiên cứu/nhà phát triển quan trọng để liên tục tối ưu hóa các mô hình AI. Không giống như các mô hình AI có thể được đào tạo trên đám mây, robot đòi hỏi sự can thiệp liên tục của con người - một thách thức lớn mà DePIN phải giải quyết.

Tương lai: Khi nào thì thời đại ChatGPT sẽ đến với ngành robot?

Một số người tin rằng thời đại ChatGPT dành cho bot sắp đến. Michael có phần hoài nghi. Ông tin rằng AI robot nói chung vẫn còn lâu mới có thể được áp dụng rộng rãi do những thách thức về phần cứng, dữ liệu và đánh giá. Tuy nhiên, sự tiến bộ của công nghệ robot DePIN vẫn mang lại hy vọng. Sự phát triển của công nghệ robot nên được phân cấp và không bị kiểm soát bởi một vài công ty lớn. Quy mô và sự phối hợp của một mạng lưới phi tập trung có thể phân bổ gánh nặng vốn. Thay vì dựa vào một công ty lớn để trả tiền cho hàng nghìn robot, chúng ta có thể đưa những cá nhân có khả năng đóng góp vào một mạng lưới chung.

Ví dụ: Đầu tiên, DePIN đẩy nhanh quá trình thu thập và đánh giá dữ liệu. Thay vì chờ một công ty triển khai một số lượng robot hạn chế để thu thập dữ liệu, các mạng phi tập trung có thể chạy song song và thu thập dữ liệu ở quy mô lớn hơn nhiều. Ví dụ, tại cuộc thi AI đấu với robot con người gần đây ở Abu Dhabi, các nhà nghiên cứu từ các học viện bao gồm DeepMind và UT Austin đã đưa các mô hình AI của họ vào thử nghiệm với những người chơi là con người. Trong khi con người vẫn chiếm ưu thế, các nhà nghiên cứu rất hào hứng với tập dữ liệu độc đáo mà họ thu thập được từ các tương tác giữa robot trong thế giới thực. Điều này nhấn mạnh nhu cầu về một mạng lưới con kết nối các thành phần khác nhau của robot. Sự nhiệt tình trong cộng đồng nghiên cứu cũng cho thấy rằng ngay cả khi tính tự chủ hoàn toàn vẫn là mục tiêu dài hạn, thì robot DePIN đã chứng minh được giá trị hữu hình từ việc thu thập dữ liệu và đào tạo cho đến triển khai và xác thực trong thế giới thực.

Mặt khác, những cải tiến trong thiết kế phần cứng do AI thúc đẩy, chẳng hạn như sử dụng AI để tối ưu hóa kỹ thuật chip và vật liệu, có thể rút ngắn đáng kể thời gian. Một ví dụ cụ thể là Phòng thí nghiệm FrodoBot đã hợp tác với các tổ chức khác để bảo đảm hai hộp GPU NVIDIA H100 - mỗi hộp chứa tám chip H100. Điều này cung cấp cho các nhà nghiên cứu sức mạnh tính toán cần thiết để xử lý và tối ưu hóa các mô hình AI trên dữ liệu thực tế thu thập được từ các lần triển khai robot. Nếu không có các tài nguyên điện toán này, ngay cả những tập dữ liệu có giá trị nhất cũng không thể được sử dụng đầy đủ. Có thể thấy rằng thông qua quyền truy cập vào cơ sở hạ tầng điện toán phi tập trung DePIN, Mạng lưới Robot cho phép các nhà nghiên cứu trên toàn thế giới đào tạo và đánh giá các mô hình mà không bị hạn chế bởi quyền sở hữu GPU đòi hỏi nhiều vốn. Nếu DePIN có thể huy động thành công nguồn dữ liệu cộng đồng và tiến bộ về phần cứng, tương lai của ngành robot có thể đến sớm hơn dự kiến.

Ngoài ra, các tác nhân AI như Sam, một bot có sức ảnh hưởng du lịch với mã thông báo meme, trình diễn các mô hình kiếm tiền mới cho các mạng lưới robot phi tập trung. Sam hoạt động tự động, phát sóng trực tiếp 24/7 tại nhiều thành phố và giá trị đồng meme của kênh này ngày càng tăng. Mô hình này chứng minh cách robot thông minh chạy bằng DEPIN có thể tự duy trì tài chính thông qua quyền sở hữu phi tập trung và các ưu đãi về mã thông báo. Trong tương lai, các tác nhân AI này thậm chí có thể sử dụng mã thông báo để trả tiền cho người vận hành để được hỗ trợ, thuê thêm tài sản robot hoặc đấu thầu các nhiệm vụ thực tế, tạo ra một chu kỳ kinh tế có lợi cho cả quá trình phát triển AI và những người tham gia DePIN.

Tóm tắt

Sự phát triển của AI robot không chỉ phụ thuộc vào thuật toán mà còn liên quan đến việc nâng cấp phần cứng, tích lũy dữ liệu, hỗ trợ tài chính và sự tham gia của con người. Trước đây, sự phát triển của ngành công nghiệp robot bị hạn chế bởi chi phí cao và sự thống trị của các công ty lớn, điều này đã cản trở tốc độ đổi mới. Việc thành lập Mạng lưới Robot DePIN có nghĩa là với sức mạnh của mạng lưới phi tập trung, việc thu thập dữ liệu robot, tài nguyên điện toán và đầu tư vốn có thể được phối hợp trên quy mô toàn cầu, điều này không chỉ đẩy nhanh quá trình đào tạo AI và tối ưu hóa phần cứng mà còn hạ thấp ngưỡng phát triển và cho phép nhiều nhà nghiên cứu, doanh nhân và người dùng cá nhân tham gia hơn. Chúng tôi cũng hy vọng rằng ngành công nghiệp robot sẽ không còn phụ thuộc vào một vài gã khổng lồ công nghệ nữa mà sẽ được cộng đồng toàn cầu thúc đẩy hướng tới một hệ sinh thái công nghệ thực sự mở và bền vững.

*Tất cả nội dung trên nền tảng Coinspire chỉ mang tính tham khảo và không cấu thành lời đề nghị hoặc khuyến nghị về bất kỳ chiến lược đầu tư nào. Bất kỳ quyết định cá nhân nào được đưa ra dựa trên nội dung của bài viết này đều là trách nhiệm riêng của nhà đầu tư và Coinspire không chịu trách nhiệm cho bất kỳ khoản lãi hoặc lỗ nào phát sinh từ đó.

Đầu tư là rủi ro, vì vậy hãy đưa ra quyết định một cách thận trọng

Bài viết gốc, tác giả:Coinspire。Tuyển dụng: Nhân viên kinh doanh phần mềm theo dự án report@odaily.email;Vi phạm quy định của pháp luật.

Odaily nhắc nhở, mời đông đảo độc giả xây dựng quan niệm đúng đắn về tiền tệ và khái niệm đầu tư, nhìn nhận hợp lý về blockchain, nâng cao nhận thức về rủi ro; Đối với manh mối phạm tội phát hiện, có thể tích cực tố cáo phản ánh với cơ quan hữu quan.

Đọc nhiều nhất
Lựa chọn của người biên tập