เมื่อวันที่ 27 กุมภาพันธ์ Messari ได้จัดรายการพอดแคสต์เรื่อง การสร้าง AI ทางกายภาพแบบกระจายอำนาจ ร่วมกับ Michael Cho ผู้ก่อตั้งร่วมของ FrodoBot Lab พวกเขาพูดคุยเกี่ยวกับความท้าทายและโอกาสของเครือข่ายโครงสร้างพื้นฐานทางกายภาพแบบกระจายอำนาจ (DePIN) ในสาขาหุ่นยนต์ แม้ว่าสาขานี้จะยังอยู่ในช่วงเริ่มต้น แต่ก็มีศักยภาพมหาศาลและสามารถเปลี่ยนแปลงวิธีการทำงานของหุ่นยนต์ AI ในโลกแห่งความเป็นจริงได้อย่างสิ้นเชิง อย่างไรก็ตาม แตกต่างจาก AI ดั้งเดิมที่ต้องพึ่งพาข้อมูลอินเทอร์เน็ตจำนวนมาก เทคโนโลยี AI หุ่นยนต์ DePIN ต้องเผชิญกับปัญหาที่ซับซ้อนกว่า เช่น การรวบรวมข้อมูล ข้อจำกัดด้านฮาร์ดแวร์ ปัญหาคอขวดในการประเมิน และความยั่งยืนของโมเดลเศรษฐกิจ
ในบทความวันนี้ เราจะแยกประเด็นสำคัญจากการอภิปรายครั้งนี้ และดูว่าระบบหุ่นยนต์ DePIN เผชิญปัญหาอะไรบ้าง อุปสรรคหลักในการขยายระบบหุ่นยนต์แบบกระจายอำนาจคืออะไร และเหตุใด DePIN จึงมีข้อได้เปรียบเหนือแนวทางแบบรวมศูนย์ ในที่สุด เราจะมาสำรวจอนาคตของหุ่นยนต์ DePIN และดูว่าเราใกล้จะมี ช่วงเวลา ChatGPT สำหรับหุ่นยนต์ DePIN หรือไม่
จุดคอขวดของหุ่นยนต์อัจฉริยะ DePIN อยู่ที่ไหน?
เมื่อไมเคิล โชเริ่มทำงานกับ FrodoBot ปัญหาใหญ่ที่สุดของเขาคือต้นทุนของเทคโนโลยีหุ่นยนต์ ราคาที่สูงเกินจริงของหุ่นยนต์เชิงพาณิชย์ในตลาดทำให้การส่งเสริมการใช้งาน AI ในโลกแห่งความเป็นจริงเป็นเรื่องยาก วิธีแก้ปัญหาเบื้องต้นของเขาคือการสร้างหุ่นยนต์อัตโนมัติต้นทุนต่ำซึ่งจะมีค่าใช้จ่ายเพียง 500 เหรียญสหรัฐ โดยตั้งเป้าที่จะลดราคาสำหรับโครงการที่มีอยู่ส่วนใหญ่
แต่เมื่อเขาและทีมเจาะลึกลงไปในการวิจัยและพัฒนา ไมเคิลก็ตระหนักว่าต้นทุนไม่ใช่อุปสรรคที่แท้จริง ความท้าทายของเครือข่ายโครงสร้างพื้นฐานทางกายภาพแบบกระจายอำนาจ (DePIN) ในระบบหุ่นยนต์มีความซับซ้อนมากกว่าคำว่า แพงหรือไม่ ในขณะที่ FrodoBotLab ยังคงก้าวหน้าต่อไป ปัญหาคอขวดต่างๆ ในเทคโนโลยีหุ่นยนต์ DePIN ค่อยๆ ปรากฏให้เห็น เพื่อให้เกิดการปรับใช้ในระดับขนาดใหญ่ จำเป็นต้องเอาชนะปัญหาคอขวดต่อไปนี้
คอขวดที่ 1: ข้อมูล
แตกต่างจากโมเดล AI แบบ ออนไลน์ ขนาดใหญ่ที่ได้รับการฝึกอบรมด้วยข้อมูลอินเทอร์เน็ตจำนวนมาก AI ในรูปแบบจริงจำเป็นต้องโต้ตอบกับโลกแห่งความเป็นจริงเพื่อพัฒนาสติปัญญา ปัญหาคือในปัจจุบันโลกไม่มีโครงสร้างพื้นฐานขนาดใหญ่ และไม่มีฉันทามติว่าจะรวบรวมข้อมูลเหล่านี้อย่างไร การรวบรวมข้อมูลสำหรับ AI ในตัวสามารถแบ่งออกเป็นสามประเภทหลัก:
▎ประเภทแรกคือ ข้อมูลการทำงานของมนุษย์ ซึ่งเป็นข้อมูลที่สร้างขึ้นเมื่อมนุษย์ควบคุมหุ่นยนต์ด้วยตนเอง ข้อมูลเหล่านี้มีคุณภาพสูงและจะบันทึกสตรีมวิดีโอและป้ายกำกับการกระทำ ซึ่งก็คือสิ่งที่มนุษย์เห็นและมีปฏิกิริยาอย่างไร นี่เป็นวิธีที่มีประสิทธิภาพที่สุดในการฝึก AI ให้เลียนแบบพฤติกรรมของมนุษย์ แต่ข้อเสียก็คือมีค่าใช้จ่ายสูงและต้องใช้แรงงานมาก
▎หมวดที่สองคือ ข้อมูลสังเคราะห์ (ข้อมูลจำลอง) ซึ่งมีประโยชน์ในการฝึกหุ่นยนต์ให้เคลื่อนที่ในภูมิประเทศที่ซับซ้อน เช่น การฝึกหุ่นยนต์ให้เดินบนภูมิประเทศขรุขระ และมีประโยชน์มากสำหรับบางสาขาพิเศษ แต่สำหรับงานที่แตกต่างกันมาก เช่น การทำอาหาร สภาพแวดล้อมจำลองจะทำงานได้ไม่ดีนัก ลองนึกภาพการฝึกหุ่นยนต์ทอดไข่ การเปลี่ยนแปลงเล็กๆ น้อยๆ ในประเภทของกระทะ อุณหภูมิของน้ำมัน และสภาพห้อง จะส่งผลต่อผลลัพธ์ และสภาพแวดล้อมเสมือนจริงก็ยากที่จะครอบคลุมทุกสถานการณ์
▎ประเภทที่สามคือ การเรียนรู้วิดีโอ ซึ่งเป็นการปล่อยให้โมเดล AI เรียนรู้โดยการดูวิดีโอของโลกแห่งความเป็นจริง แม้ว่าแนวทางนี้จะมีศักยภาพ แต่ยังขาดการตอบรับทางกายภาพโดยตรงแบบโต้ตอบที่แท้จริงที่จำเป็นสำหรับข่าวกรอง
คอขวดที่ 2: ระดับของความเป็นอิสระ
ไมเคิลกล่าวว่าเมื่อครั้งที่เขาทดสอบ FrodoBot ในโลกแห่งความเป็นจริงเป็นครั้งแรก เขามักจะใช้หุ่นยนต์เพื่อการส่งของในช่วงสุดท้าย เมื่อพิจารณาจากข้อมูล ผลลัพธ์ถือว่าค่อนข้างดีเลยทีเดียว หุ่นยนต์สามารถทำภารกิจส่งมอบสินค้าสำเร็จได้ 90% แต่ในชีวิตจริง อัตราความล้มเหลว 10% ถือว่าไม่สามารถยอมรับได้ หุ่นยนต์ที่ล้มเหลวหนึ่งในสิบครั้งในการส่งมอบไม่สามารถนำไปใช้ในเชิงพาณิชย์ได้ รถยนต์ไร้คนขับสามารถทดลองขับได้สำเร็จถึง 10,000 ครั้ง เช่นเดียวกับเทคโนโลยีการขับขี่อัตโนมัติ แต่ความล้มเหลวเพียงครั้งเดียวก็เพียงพอที่จะทำลายความเชื่อมั่นของผู้บริโภคเชิงพาณิชย์ได้
ดังนั้น เพื่อให้หุ่นยนต์สามารถใช้งานได้จริง อัตราความสำเร็จจะต้องใกล้เคียง 99.99% หรือสูงกว่านั้น แต่ปัญหาคือการปรับปรุงความแม่นยำทุกๆ 0.001% ต้องใช้เวลาและความพยายามเพิ่มมากขึ้นอย่างทวีคูณ หลายๆ คนประเมินความยากของขั้นตอนสุดท้ายนี้ต่ำเกินไป
ไมเคิลเล่าว่าเมื่อเขาได้นั่งอยู่ในต้นแบบรถยนต์ขับเคลื่อนอัตโนมัติของ Google ในปี 2015 เขารู้สึกว่าการขับขี่อัตโนมัติแบบเต็มรูปแบบใกล้จะเกิดขึ้นแล้ว สิบปีต่อมา เรายังคงถกเถียงกันอยู่ว่าเมื่อใดเราจะบรรลุความเป็นอิสระเต็มที่ระดับ 5 ความก้าวหน้าของหุ่นยนต์ไม่ได้เป็นแบบเส้นตรงแต่เป็นแบบทวีคูณ ยิ่งแต่ละก้าวไปข้างหน้า ความยากก็จะเพิ่มขึ้นอย่างมาก ความแม่นยำ 1% สุดท้ายนี้อาจต้องใช้เวลาหลายปีหรือหลายทศวรรษจึงจะบรรลุผล
ปัญหาคอขวดที่ 3: ฮาร์ดแวร์: AI เพียงอย่างเดียวไม่สามารถแก้ไขปัญหาหุ่นยนต์ได้
พูดอีกอย่างหนึ่งก็คือ แม้ว่าโมเดล AI จะทรงพลัง แต่ฮาร์ดแวร์หุ่นยนต์ที่มีอยู่ก็ยังไม่พร้อมที่จะบรรลุความเป็นอิสระอย่างแท้จริง ตัวอย่างเช่น ปัญหาด้านฮาร์ดแวร์ที่มักมองข้ามได้ง่ายที่สุดคือการขาดเซ็นเซอร์สัมผัส เทคโนโลยีที่ดีที่สุดในปัจจุบัน เช่น การวิจัยของ Meta AI ยังคงห่างไกลจากความไวของปลายนิ้วมนุษย์ ในขณะที่มนุษย์อาศัยการมองเห็นและการสัมผัสในการโต้ตอบกับโลก หุ่นยนต์กลับมีความรู้น้อยมากเกี่ยวกับพื้นผิว การจับ และการตอบรับแรงกด
นอกจากนี้ยังมีปัญหาด้านการอุดตันอีกด้วย เมื่อวัตถุถูกอุดตันเพียงบางส่วน หุ่นยนต์ก็จะจดจำและโต้ตอบกับวัตถุนั้นได้ยาก แม้ว่ามนุษย์จะไม่สามารถมองเห็นภาพรวมของวัตถุได้ทั้งหมด แต่พวกเขาก็สามารถเข้าใจมันได้โดยสัญชาตญาณ
นอกเหนือจากปัญหาด้านการรับรู้แล้ว ตัวกระตุ้นหุ่นยนต์เองก็มีข้อบกพร่องเช่นกัน หุ่นยนต์ที่มีรูปร่างเหมือนมนุษย์ส่วนใหญ่จะวางตัวกระตุ้นไว้บนข้อต่อโดยตรง ทำให้มีขนาดใหญ่และอาจเป็นอันตรายได้ ในทางตรงกันข้าม โครงสร้างเอ็นของมนุษย์ช่วยให้เคลื่อนไหวได้ราบรื่นและปลอดภัยยิ่งขึ้น นี่คือเหตุผลที่หุ่นยนต์ที่มีรูปร่างเหมือนมนุษย์ในปัจจุบันดูแข็งทื่อและไม่ยืดหยุ่น บริษัทต่างๆ เช่น Apptronik กำลังพัฒนาการออกแบบตัวกระตุ้นที่ได้รับแรงบันดาลใจจากชีวภาพมากขึ้น แต่การสร้างสรรค์นวัตกรรมเหล่านี้จะต้องใช้เวลาในการเติบโตให้สมบูรณ์
คอขวดที่ 4: เหตุใดการขยายฮาร์ดแวร์จึงยากนัก?
ต่างจากโมเดล AI ดั้งเดิมที่ต้องอาศัยพลังการประมวลผลเพียงอย่างเดียว การนำเทคโนโลยีหุ่นยนต์อัจฉริยะมาใช้จำเป็นต้องมีการปรับใช้อุปกรณ์ทางกายภาพในโลกแห่งความเป็นจริง สิ่งนี้ก่อให้เกิดความท้าทายด้านเงินทุนที่ยิ่งใหญ่ การสร้างหุ่นยนต์นั้นมีค่าใช้จ่ายสูง และมีเพียงบริษัทที่ร่ำรวยที่สุดเท่านั้นที่สามารถทำการทดลองขนาดใหญ่ได้ แม้แต่หุ่นยนต์ที่มีรูปร่างเหมือนมนุษย์ที่มีประสิทธิภาพสูงสุดในปัจจุบันก็ยังมีต้นทุนสูงถึงหลายหมื่นดอลลาร์ ทำให้การนำไปใช้งานในวงกว้างเป็นเรื่องที่ไม่สมจริง
คอขวดที่ 5: ประสิทธิผลของการประเมิน
นี่คือคอขวดที่ มองไม่เห็น ลองนึกดูว่าโมเดล AI ออนไลน์ขนาดใหญ่ เช่น ChatGPT สามารถทดสอบฟังก์ชันต่างๆ ได้เกือบจะทันที - หลังจากที่โมเดลภาษาใหม่ได้รับการเผยแพร่ นักวิจัยหรือผู้ใช้ทั่วไปทั่วโลกก็สามารถสรุปประสิทธิภาพการทำงานของโมเดลดังกล่าวได้ภายในเวลาไม่กี่ชั่วโมง แต่การประเมิน AI ทางกายภาพต้องอาศัยการใช้งานจริงซึ่งต้องใช้เวลา
ซอฟต์แวร์ Full Self-Driving (FSD) ของ Tesla เป็นตัวอย่างที่ดี หากรถ Tesla วิ่งได้ 1 ล้านไมล์โดยไม่เกิดอุบัติเหตุ นั่นหมายความว่ารถได้บรรลุระดับความอัตโนมัติระดับ 5 อย่างแท้จริงแล้วใช่หรือไม่ แล้ว 10 ล้านไมล์ล่ะ? ปัญหาของระบบปัญญาประดิษฐ์คือ วิธีเดียวที่จะตรวจสอบได้ก็คือต้องดูว่าระบบนั้นล้มเหลวตรงไหน ซึ่งก็หมายถึงการปรับใช้แบบเรียลไทม์ในระยะยาวและมีขนาดใหญ่
คอขวดที่ 6: ทรัพยากรบุคคล
ความท้าทายที่ถูกประเมินต่ำอีกประการหนึ่งก็คือแรงงานมนุษย์ยังคงขาดไม่ได้ในการพัฒนาปัญญาประดิษฐ์ (AI) AI เพียงอย่างเดียวไม่เพียงพอ หุ่นยนต์ต้องมีผู้ควบคุมที่เป็นมนุษย์เพื่อให้ข้อมูลการฝึกอบรม มีทีมบำรุงรักษาเพื่อให้หุ่นยนต์ทำงานได้ และต้องมีนักวิจัย/นักพัฒนาที่จำเป็นเพื่อเพิ่มประสิทธิภาพโมเดล AI อย่างต่อเนื่อง ต่างจากโมเดล AI ที่สามารถฝึกได้ในระบบคลาวด์ หุ่นยนต์ต้องได้รับการแทรกแซงจากมนุษย์ตลอดเวลา ซึ่งเป็นความท้าทายสำคัญที่ DePIN ต้องจัดการ
อนาคต: เมื่อไหร่ ChatGPT จะมาถึงยุคของหุ่นยนต์?
บางคนเชื่อว่ายุค ChatGPT สำหรับบอทกำลังจะมาถึง ไมเคิลรู้สึกค่อนข้างจะสงสัย เขาเชื่อว่าปัญญาประดิษฐ์ (AI) หุ่นยนต์ทั่วไปยังคงห่างไกลจากการยอมรับอย่างแพร่หลาย เนื่องด้วยความท้าทายในด้านฮาร์ดแวร์ ข้อมูล และการประเมิน อย่างไรก็ตาม ความก้าวหน้าของเทคโนโลยีหุ่นยนต์ของ DePIN ก็ยังคงให้ความหวังอยู่ การพัฒนาเทคโนโลยีหุ่นยนต์ควรจะกระจายอำนาจ ไม่ใช่ควบคุมโดยบริษัทใหญ่เพียงไม่กี่แห่ง ขนาดและการประสานงานของเครือข่ายแบบกระจายอำนาจสามารถกระจายภาระเงินทุนได้ แทนที่จะพึ่งพาบริษัทใหญ่ให้จ่ายเงินเพื่อซื้อหุ่นยนต์นับพันตัว เราสามารถนำบุคลากรที่สามารถมีส่วนสนับสนุนเข้าสู่เครือข่ายร่วมกันได้
ตัวอย่างเช่น -- ประการแรก DePIN เร่งการรวบรวมและการประเมินข้อมูล แทนที่จะรอให้บริษัทเดียวใช้งานหุ่นยนต์จำนวนจำกัดเพื่อรวบรวมข้อมูล เครือข่ายแบบกระจายอำนาจสามารถทำงานแบบคู่ขนานและรวบรวมข้อมูลในระดับที่ใหญ่กว่าได้มาก ตัวอย่างเช่น ในการแข่งขันหุ่นยนต์ AI กับมนุษย์เมื่อไม่นานนี้ที่อาบูดาบี นักวิจัยจากสถาบันต่างๆ รวมถึง DeepMind และ UT Austin ได้นำโมเดล AI ของตนไปทดสอบกับผู้เล่นมนุษย์ แม้ว่ามนุษย์ยังคงเป็นฝ่ายได้เปรียบ แต่บรรดานักวิจัยก็ตื่นเต้นกับชุดข้อมูลเฉพาะตัวที่พวกเขาได้รวบรวมมาจากการโต้ตอบของหุ่นยนต์ในโลกแห่งความเป็นจริง สิ่งนี้เน้นย้ำถึงความจำเป็นในการมีเครือข่ายย่อยที่จะเชื่อมต่อส่วนประกอบต่างๆ ของหุ่นยนต์ ความกระตือรือร้นในชุมชนนักวิจัยยังแสดงให้เห็นอีกว่า แม้ว่าการทำงานอัตโนมัติเต็มรูปแบบจะยังคงเป็นเป้าหมายในระยะยาว แต่หุ่นยนต์ DePIN ก็ได้แสดงให้เห็นถึงมูลค่าที่จับต้องได้ตั้งแต่การรวบรวมและฝึกอบรมข้อมูลไปจนถึงการใช้งานและการตรวจสอบในโลกแห่งความเป็นจริง
ในทางกลับกัน การปรับปรุงการออกแบบฮาร์ดแวร์ที่ขับเคลื่อนด้วย AI เช่น การใช้ AI เพื่อเพิ่มประสิทธิภาพชิปและวิศวกรรมวัสดุ อาจช่วยลดระยะเวลาได้อย่างมาก ตัวอย่างที่เฉพาะเจาะจงอย่างหนึ่งคือ FrodoBot Lab ที่ทำงานร่วมกับสถาบันอื่นๆ เพื่อให้ได้กล่อง GPU NVIDIA H100 จำนวนสองกล่อง โดยแต่ละกล่องมีชิป H100 จำนวนแปดชิ้น สิ่งนี้จะช่วยให้นักวิจัยมีพลังการประมวลผลที่จำเป็นในการประมวลผลและเพิ่มประสิทธิภาพโมเดล AI บนข้อมูลจริงที่รวบรวมจากการใช้งานหุ่นยนต์ หากไม่มีทรัพยากรการประมวลผลดังกล่าว แม้แต่ชุดข้อมูลที่มีค่าที่สุดก็ไม่สามารถใช้ประโยชน์ได้อย่างเต็มที่ จะเห็นได้ว่าการเข้าถึงโครงสร้างพื้นฐานการประมวลผลแบบกระจายอำนาจ DePIN ช่วยให้เครือข่ายหุ่นยนต์ช่วยให้ผู้วิจัยทั่วโลกสามารถฝึกอบรมและประเมินโมเดลต่างๆ ได้โดยไม่ต้องถูกจำกัดด้วยความเป็นเจ้าของ GPU ที่ต้องใช้เงินทุนจำนวนมาก หาก DePIN สามารถระดมข้อมูลและความก้าวหน้าด้านฮาร์ดแวร์จากบุคคลจำนวนมากได้สำเร็จ อนาคตของหุ่นยนต์อาจมาถึงเร็วกว่าที่คาดไว้
นอกจากนี้ ตัวแทน AI เช่น Sam ซึ่งเป็นบอทผู้มีอิทธิพลในการเดินทางซึ่งมีโทเค็นมีม ยังสาธิตโมเดลการสร้างรายได้ใหม่สำหรับเครือข่ายหุ่นยนต์แบบกระจายอำนาจ Sam ทำงานโดยอัตโนมัติ ออกอากาศสดตลอด 24 ชั่วโมงทุกวันในหลายเมือง และเหรียญมีมของมันก็มีมูลค่าเพิ่มมากขึ้นเรื่อยๆ โมเดลนี้แสดงให้เห็นว่าหุ่นยนต์อัจฉริยะที่ขับเคลื่อนด้วย DEPIN สามารถจัดการการเงินของตัวเองได้อย่างไรผ่านการเป็นเจ้าของแบบกระจายอำนาจและแรงจูงใจทางโทเค็น ในอนาคต ตัวแทน AI เหล่านี้อาจใช้โทเค็นเพื่อจ่ายเงินให้กับเจ้าหน้าที่เพื่อขอความช่วยเหลือ เช่าสินทรัพย์หุ่นยนต์เพิ่มเติม หรือเสนอราคาสำหรับงานในโลกแห่งความเป็นจริง ซึ่งจะสร้างวัฏจักรเศรษฐกิจที่ให้ประโยชน์ต่อทั้งการพัฒนา AI และผู้เข้าร่วม DePIN
สรุป
การพัฒนาปัญญาประดิษฐ์ของหุ่นยนต์ไม่เพียงแต่ขึ้นอยู่กับอัลกอริทึมเท่านั้น แต่ยังเกี่ยวข้องกับการอัพเกรดฮาร์ดแวร์ การรวบรวมข้อมูล การสนับสนุนทางการเงิน และการมีส่วนร่วมของมนุษย์ด้วย ในอดีตการพัฒนาอุตสาหกรรมหุ่นยนต์ถูกจำกัดด้วยต้นทุนที่สูงและการครอบงำของบริษัทขนาดใหญ่ซึ่งขัดขวางความก้าวหน้าของนวัตกรรม การจัดตั้งเครือข่ายหุ่นยนต์ DePIN หมายความว่าด้วยพลังของเครือข่ายแบบกระจายอำนาจ การรวบรวมข้อมูลหุ่นยนต์ ทรัพยากรคอมพิวเตอร์ และการลงทุนด้านทุนสามารถประสานงานได้ในระดับโลก ซึ่งไม่เพียงแต่จะเร่งการฝึกอบรม AI และการเพิ่มประสิทธิภาพของฮาร์ดแวร์เท่านั้น แต่ยังช่วยลดเกณฑ์การพัฒนาและอนุญาตให้ผู้วิจัย ผู้ประกอบการ และผู้ใช้รายบุคคลมีส่วนร่วมได้มากขึ้นอีกด้วย เรายังหวังว่าอุตสาหกรรมหุ่นยนต์จะไม่พึ่งพาเทคโนโลยียักษ์ใหญ่เพียงไม่กี่แห่งอีกต่อไป แต่จะถูกขับเคลื่อนโดยชุมชนโลกเพื่อก้าวไปสู่ระบบนิเวศเทคโนโลยีที่เปิดกว้างและยั่งยืนอย่างแท้จริง
*เนื้อหาทั้งหมดบนแพลตฟอร์ม Coinspire มีไว้สำหรับการอ้างอิงเท่านั้นและไม่ถือเป็นข้อเสนอหรือคำแนะนำเกี่ยวกับกลยุทธ์การลงทุนใดๆ การตัดสินใจส่วนบุคคลใดๆ ที่เกิดขึ้นจากเนื้อหาของบทความนี้ถือเป็นความรับผิดชอบของนักลงทุนแต่เพียงผู้เดียว และ Coinspire จะไม่รับผิดชอบต่อกำไรหรือขาดทุนใดๆ ที่เกิดขึ้น
การลงทุนมีความเสี่ยง ดังนั้นควรตัดสินใจด้วยความระมัดระวัง