สถาบันวิจัยโตโยต้าเผยความก้าวหน้าในการสอนพฤติกรรมใหม่ให้กับหุ่นยนต์ด้วยเทคนิคเจนเนอเรทีฟ AI ใหม่

สถาบันวิจัยโตโยต้า (TRI) ประกาศแนวทางเจนเนอเรทีฟ AI ที่ล้ำสมัยโดยอยู่บนพื้นฐานของนโยบายการแพร่กระจาย (Diffusion Policy) เพื่อสอนทักษะใหม่ๆ ที่คล่องแคล่วและรวดเร็วให้กับหุ่นยนต์ ความก้าวหน้านี้สามารถเพิ่มการใช้ประโยชน์จากหุ่นยนต์ได้อย่างมีนัยสำคัญ และเป็นก้าวต่อไปของการสร้าง “แบบจำลองพฤติกรรมขนาดใหญ่ (LBM)” สำหรับหุ่นยนต์ ซึ่งคล้ายกับโมเดลภาษาขนาดใหญ่ (LLM) ที่เพิ่งปฏิวัติ AI เกี่ยวกับการสนทนาเมื่อไม่นานมานี้

สถาบันวิจัยโตโยต้าเปิดเผยความก้าวหน้าในการสอนพฤติกรรมใหม่ให้กับหุ่นยนต์ โดยใช้เทคนิคเจนเนอเรทีฟ AI ที่ล้ำสมัย ที่จะเป็นก้าวต่อไปของการสร้างแบบจำลองพฤติกรรมขนาดใหญ่

Gill Pratt ซีอีโอของ TRI และหัวหน้านักวิทยาศาสตร์ของ Toyota Motor Corporation กล่าวว่า — “การวิจัยด้านวิทยาการหุ่นยนต์ของเรามุ่งไปที่การขยายผู้คนมากกว่าการเข้าไปแทนพวกเขา” “เทคนิคการสอนใหม่นี้มีประสิทธิภาพมาก และก่อให้เกิดพฤติกรรมที่มีสมรรถนะสูงมาก ทำให้หุ่นยนต์สามารถขยายผู้คนได้อย่างมีประสิทธิผลมากขึ้นในหลายๆ ด้าน”

ก่อนหน้านี้ เทคนิคที่นำมาใช้สอนหุ่นยนต์ให้มีพฤติกรรมใหม่แม้จะมีความล้ำสมัย แต่ก็ทำได้ช้า ไม่สอดคล้องกัน ไม่มีประสิทธิภาพ และมักจำกัดไว้เพียงการปฏิบัติตามภาระงานที่กำหนดไว้อย่างแคบในสภาพแวดล้อมที่มีข้อจำกัดสูง นักวิทยาการหุ่นยนต์ต้องใช้เวลาหลายชั่วโมงในการเขียนโค้ดที่ซับซ้อน และ/หรือใช้การลองผิดลองถูกอยู่หลายรอบมากในการเขียนโปรแกรมพฤติกรรม

TRI ได้สอนทักษะที่ยากและคล่องแคล่วให้กับหุ่นยนต์มาแล้วกว่า 60 ทักษะโดยใช้แนวทางใหม่ ซึ่งรวมถึงการเทของเหลว การใช้เครื่องมือ และการจัดการวัตถุที่เปลี่ยนรูปทรงได้ ความสำเร็จเหล่านี้เกิดขึ้นได้โดยไม่ต้องเขียนโค้ดใหม่แม้แต่บรรทัดเดียว ซึ่งการเปลี่ยนแปลงมีเพียงอย่างเดียว คือ การให้ข้อมูลใหม่แก่หุ่นยนต์ จากความสำเร็จนี้ TRI ได้ตั้งเป้าหมายด้วยความทะเยอทะยานมากขึ้นในการสอนทักษะใหม่ๆ หลายร้อยทักษะภายในสิ้นปีนี้ และให้ได้ 1,000 ทักษะภายในสิ้นปี พ.ศ. 2567

นอกจากนี้ ยังสามารถสอนหุ่นยนต์ให้ทำงานในสถานการณ์ใหม่และมีพฤติกรรมที่หลากหลายได้ ทักษะเหล่านี้ไม่ได้จำกัดอยู่เพียงแค่ “หยิบและวาง” หรือเพียงแค่หยิบสิ่งของและวางลงในตำแหน่งใหม่ โดยขณะนี้ หุ่นยนต์ของ TRI สามารถโต้ตอบกับโลกในรูปแบบที่หลากหลายและสมบูรณ์ ซึ่งสักวันหนึ่งจะช่วยให้หุ่นยนต์สามารถช่วยเหลือผู้คนในสถานการณ์ในชีวิตประจำวัน และในสภาพแวดล้อมที่คาดเดาไม่ได้และเปลี่ยนแปลงตลอดเวลา

Russ Tedrake รองประธานฝ่ายวิจัยหุ่นยนต์ของ TRI และเป็นศาสตราจารย์ด้านวิศวกรรมไฟฟ้าและวิทยาการคอมพิวเตอร์ การบินและอวกาศ และวิศวกรรมเครื่องกลของ MIT อธิบายว่า — “สิ่งที่น่าตื่นเต้นอย่างมากเกี่ยวกับแนวทางใหม่นี้ คือ อัตรา และความน่าเชื่อถือจากการที่เราสามารถเพิ่มทักษะใหม่ๆ ได้ เนื่องจากทักษะเหล่านี้เป็นการทำงานโดยตรงจากภาพที่ได้จากกล้อง และจากการตรวจจับแบบสัมผัสโดยใช้เพียงตัวอย่างจากที่เรียนรู้เท่านั้น ทักษะเหล่านี้จึงสามารถปฏิบัติได้ดีแม้จะเป็นงานที่เกี่ยวข้องกับสิ่งที่เปลี่ยนรูปทรงได้ทั้ง วัตถุ เสื้อผ้า และของเหลว ซึ่งแต่เดิมแล้วทักษะทั้งหมดนี้เป็นเรื่องยากมากสำหรับหุ่นยนต์”

รายละเอียดทางเทคนิค

โมเดลพฤติกรรมหุ่นยนต์ของ TRI เป็นการเรียนรู้ด้วยการสาธิตการรับรู้จากการสัมผัสโดยผู้สอน และรวมกับคำอธิบายภาษาของเป้าหมาย จากนั้นใช้นโยบายการแพร่กระจายบนพื้นฐานของ AI เพื่อเรียนรู้ทักษะจากที่ได้สาธิตให้เห็น กระบวนการนี้ช่วยให้ปรับใช้พฤติกรรมใหม่ได้โดยอัตโนมัติจากการสาธิตหลายสิบครั้ง แนวทางนี้ไม่เพียงแต่ให้ผลลัพธ์ที่สม่ำเสมอ ทำซ้ำได้ และมีประสิทธิภาพเท่านั้น แต่ยังทำได้อย่างรวดเร็วอีกด้วย

ความสำเร็จที่สำคัญในการวิจัยและพัฒนาใหม่ของ TRI นี้ ได้แก่

นโยบายการแพร่กระจาย: TRI และผู้ร่วมงานในกลุ่มของศาสตราจารย์ Song ที่มหาวิทยาลัยโคลัมเบียได้พัฒนาแนวทางเจนเนอเรทีฟ AI ที่ทรงพลังสำหรับการเรียนรู้พฤติกรรม แนวทางนี้เรียกว่า นโยบายการแพร่กระจาย ช่วยให้การสอนพฤติกรรมจากการสาธิตทำได้ง่ายและรวดเร็ว

แพลตฟอร์มหุ่นยนต์ที่ปรับแต่งเฉพาะได้: แพลตฟอร์มหุ่นยนต์ของ TRI สร้างขึ้นเป็นพิเศษสำหรับงานควบคุมแขนคู่ที่คล่องแคล่ว โดยเน้นเป็นพิเศษสำหรับความสามารถในการป้อนกลับการสัมผัส (haptic feedback) และการตรวจจับแบบกายสัมผัส (tactile sensing)

Pipeline: หุ่นยนต์ TRI ได้เรียนรู้ทักษะความคล่องแคล่วมาแล้ว 60 ทักษะ โดยมีเป้าหมายหลักร้อยภายในสิ้นปีนี้ และ 1,000 ทักษะภายในสิ้นปี พ.ศ. 2567

Drake: เป็นโมเดลพื้นฐานการออกแบบหุ่นยนต์ที่ให้มีกล่องเครื่องมือและแพลตฟอร์มการจำลองที่ล้ำสมัย ซึ่งความสมจริงในระดับสูงของ Drake ช่วยให้มีความสามารถในการพัฒนาทั้งการจำลองและในความเป็นจริงที่สามารถเพิ่มขนาดและความเร็วได้อย่างมากมายเกินกว่าจะเป็นไปได้ กลุ่มหุ่นยนต์ภายใน TRI ถูกสร้างขึ้นโดยใช้วิธีการปรับให้เหมาะสมและใช้เฟรมเวิร์กระบบของ Drake และยังสร้าง Drake เป็นโอเพ่นซอร์ส เพื่อกระตุ้นการทำงานในชุมชนหุ่นยนต์ทั้งหมด

ความปลอดภัย: เป็นหัวใจสำคัญในความพยายามด้านวิทยาการหุ่นยนต์ของ TRI โดยออกแบบระบบให้มีการป้องกันด้วยความแข็งแกร่ง ซึ่งขับเคลื่อนโดย Drake และชุดควบคุมหุ่นยนต์แบบกำหนดเองของ TRI เพื่อให้แน่ใจว่าหุ่นยนต์คำนึงถึงการรับประกันด้านความปลอดภัย เช่น การไม่ชนกับตัวมันเองหรือสภาพแวดล้อมของมัน

ที่มา: Toyota Research Institute

About pawarit

Check Also

จาก AI สู่การครองโลกวิศวกรรม: งาน GTC 2026 ชี้ชัด Nvidia แทรกซึมอยู่ทุกที่

งาน GTC 2026 ของ Nvidia ล่าสุด ไม่ได้มีหน้าฉากแค่เรื่องของ AI เท่านั้น แต่ยังเป็นเวทีโชว์ความเหนียวแน่นกับบรรดามิตรแท้ในวงการซอฟต์แวร์วิศวกรรมอีกด้วย

Microchip เปิดตัว Hybrid MCU แบบ System-in-Package ที่ผ่านการรับรองมาตรฐานยานยนต์ สำหรับการใช้งานด้านเทคโนโลยีตัวกลางระหว่างมนุษย์กับเครื่องจักร [PR]

ผู้ออกแบบระบบยานยนต์และระบบการขับเคลื่อนด้วยไฟฟ้า (E-Mobility) กำลังนำส่วนตัวกลางระหว่างมนุษย์กับเครื่องจักร (Human-Machine Interface: HMI) ที่มีกราฟิกขั้นสูงมาใช้งานมากขึ้น เพื่อยกระดับประสบการณ์ของผู้ใช้งานและเพื่อรองรับความต้องการโซลูชัน HMI ที่เพิ่มสูงขึ้น Microchip Technology (Nasdaq: MCHP) จึงประกาศเปิดตัว …