สถาบันวิจัยโตโยต้าเผยความก้าวหน้าในการสอนพฤติกรรมใหม่ให้กับหุ่นยนต์ด้วยเทคนิคเจนเนอเรทีฟ AI ใหม่

สถาบันวิจัยโตโยต้า (TRI) ประกาศแนวทางเจนเนอเรทีฟ AI ที่ล้ำสมัยโดยอยู่บนพื้นฐานของนโยบายการแพร่กระจาย (Diffusion Policy) เพื่อสอนทักษะใหม่ๆ ที่คล่องแคล่วและรวดเร็วให้กับหุ่นยนต์ ความก้าวหน้านี้สามารถเพิ่มการใช้ประโยชน์จากหุ่นยนต์ได้อย่างมีนัยสำคัญ และเป็นก้าวต่อไปของการสร้าง “แบบจำลองพฤติกรรมขนาดใหญ่ (LBM)” สำหรับหุ่นยนต์ ซึ่งคล้ายกับโมเดลภาษาขนาดใหญ่ (LLM) ที่เพิ่งปฏิวัติ AI เกี่ยวกับการสนทนาเมื่อไม่นานมานี้

สถาบันวิจัยโตโยต้าเปิดเผยความก้าวหน้าในการสอนพฤติกรรมใหม่ให้กับหุ่นยนต์ โดยใช้เทคนิคเจนเนอเรทีฟ AI ที่ล้ำสมัย ที่จะเป็นก้าวต่อไปของการสร้างแบบจำลองพฤติกรรมขนาดใหญ่

Gill Pratt ซีอีโอของ TRI และหัวหน้านักวิทยาศาสตร์ของ Toyota Motor Corporation กล่าวว่า — “การวิจัยด้านวิทยาการหุ่นยนต์ของเรามุ่งไปที่การขยายผู้คนมากกว่าการเข้าไปแทนพวกเขา” “เทคนิคการสอนใหม่นี้มีประสิทธิภาพมาก และก่อให้เกิดพฤติกรรมที่มีสมรรถนะสูงมาก ทำให้หุ่นยนต์สามารถขยายผู้คนได้อย่างมีประสิทธิผลมากขึ้นในหลายๆ ด้าน”

ก่อนหน้านี้ เทคนิคที่นำมาใช้สอนหุ่นยนต์ให้มีพฤติกรรมใหม่แม้จะมีความล้ำสมัย แต่ก็ทำได้ช้า ไม่สอดคล้องกัน ไม่มีประสิทธิภาพ และมักจำกัดไว้เพียงการปฏิบัติตามภาระงานที่กำหนดไว้อย่างแคบในสภาพแวดล้อมที่มีข้อจำกัดสูง นักวิทยาการหุ่นยนต์ต้องใช้เวลาหลายชั่วโมงในการเขียนโค้ดที่ซับซ้อน และ/หรือใช้การลองผิดลองถูกอยู่หลายรอบมากในการเขียนโปรแกรมพฤติกรรม

TRI ได้สอนทักษะที่ยากและคล่องแคล่วให้กับหุ่นยนต์มาแล้วกว่า 60 ทักษะโดยใช้แนวทางใหม่ ซึ่งรวมถึงการเทของเหลว การใช้เครื่องมือ และการจัดการวัตถุที่เปลี่ยนรูปทรงได้ ความสำเร็จเหล่านี้เกิดขึ้นได้โดยไม่ต้องเขียนโค้ดใหม่แม้แต่บรรทัดเดียว ซึ่งการเปลี่ยนแปลงมีเพียงอย่างเดียว คือ การให้ข้อมูลใหม่แก่หุ่นยนต์ จากความสำเร็จนี้ TRI ได้ตั้งเป้าหมายด้วยความทะเยอทะยานมากขึ้นในการสอนทักษะใหม่ๆ หลายร้อยทักษะภายในสิ้นปีนี้ และให้ได้ 1,000 ทักษะภายในสิ้นปี พ.ศ. 2567

นอกจากนี้ ยังสามารถสอนหุ่นยนต์ให้ทำงานในสถานการณ์ใหม่และมีพฤติกรรมที่หลากหลายได้ ทักษะเหล่านี้ไม่ได้จำกัดอยู่เพียงแค่ “หยิบและวาง” หรือเพียงแค่หยิบสิ่งของและวางลงในตำแหน่งใหม่ โดยขณะนี้ หุ่นยนต์ของ TRI สามารถโต้ตอบกับโลกในรูปแบบที่หลากหลายและสมบูรณ์ ซึ่งสักวันหนึ่งจะช่วยให้หุ่นยนต์สามารถช่วยเหลือผู้คนในสถานการณ์ในชีวิตประจำวัน และในสภาพแวดล้อมที่คาดเดาไม่ได้และเปลี่ยนแปลงตลอดเวลา

Russ Tedrake รองประธานฝ่ายวิจัยหุ่นยนต์ของ TRI และเป็นศาสตราจารย์ด้านวิศวกรรมไฟฟ้าและวิทยาการคอมพิวเตอร์ การบินและอวกาศ และวิศวกรรมเครื่องกลของ MIT อธิบายว่า — “สิ่งที่น่าตื่นเต้นอย่างมากเกี่ยวกับแนวทางใหม่นี้ คือ อัตรา และความน่าเชื่อถือจากการที่เราสามารถเพิ่มทักษะใหม่ๆ ได้ เนื่องจากทักษะเหล่านี้เป็นการทำงานโดยตรงจากภาพที่ได้จากกล้อง และจากการตรวจจับแบบสัมผัสโดยใช้เพียงตัวอย่างจากที่เรียนรู้เท่านั้น ทักษะเหล่านี้จึงสามารถปฏิบัติได้ดีแม้จะเป็นงานที่เกี่ยวข้องกับสิ่งที่เปลี่ยนรูปทรงได้ทั้ง วัตถุ เสื้อผ้า และของเหลว ซึ่งแต่เดิมแล้วทักษะทั้งหมดนี้เป็นเรื่องยากมากสำหรับหุ่นยนต์”

รายละเอียดทางเทคนิค

โมเดลพฤติกรรมหุ่นยนต์ของ TRI เป็นการเรียนรู้ด้วยการสาธิตการรับรู้จากการสัมผัสโดยผู้สอน และรวมกับคำอธิบายภาษาของเป้าหมาย จากนั้นใช้นโยบายการแพร่กระจายบนพื้นฐานของ AI เพื่อเรียนรู้ทักษะจากที่ได้สาธิตให้เห็น กระบวนการนี้ช่วยให้ปรับใช้พฤติกรรมใหม่ได้โดยอัตโนมัติจากการสาธิตหลายสิบครั้ง แนวทางนี้ไม่เพียงแต่ให้ผลลัพธ์ที่สม่ำเสมอ ทำซ้ำได้ และมีประสิทธิภาพเท่านั้น แต่ยังทำได้อย่างรวดเร็วอีกด้วย

ความสำเร็จที่สำคัญในการวิจัยและพัฒนาใหม่ของ TRI นี้ ได้แก่

นโยบายการแพร่กระจาย: TRI และผู้ร่วมงานในกลุ่มของศาสตราจารย์ Song ที่มหาวิทยาลัยโคลัมเบียได้พัฒนาแนวทางเจนเนอเรทีฟ AI ที่ทรงพลังสำหรับการเรียนรู้พฤติกรรม แนวทางนี้เรียกว่า นโยบายการแพร่กระจาย ช่วยให้การสอนพฤติกรรมจากการสาธิตทำได้ง่ายและรวดเร็ว

แพลตฟอร์มหุ่นยนต์ที่ปรับแต่งเฉพาะได้: แพลตฟอร์มหุ่นยนต์ของ TRI สร้างขึ้นเป็นพิเศษสำหรับงานควบคุมแขนคู่ที่คล่องแคล่ว โดยเน้นเป็นพิเศษสำหรับความสามารถในการป้อนกลับการสัมผัส (haptic feedback) และการตรวจจับแบบกายสัมผัส (tactile sensing)

Pipeline: หุ่นยนต์ TRI ได้เรียนรู้ทักษะความคล่องแคล่วมาแล้ว 60 ทักษะ โดยมีเป้าหมายหลักร้อยภายในสิ้นปีนี้ และ 1,000 ทักษะภายในสิ้นปี พ.ศ. 2567

Drake: เป็นโมเดลพื้นฐานการออกแบบหุ่นยนต์ที่ให้มีกล่องเครื่องมือและแพลตฟอร์มการจำลองที่ล้ำสมัย ซึ่งความสมจริงในระดับสูงของ Drake ช่วยให้มีความสามารถในการพัฒนาทั้งการจำลองและในความเป็นจริงที่สามารถเพิ่มขนาดและความเร็วได้อย่างมากมายเกินกว่าจะเป็นไปได้ กลุ่มหุ่นยนต์ภายใน TRI ถูกสร้างขึ้นโดยใช้วิธีการปรับให้เหมาะสมและใช้เฟรมเวิร์กระบบของ Drake และยังสร้าง Drake เป็นโอเพ่นซอร์ส เพื่อกระตุ้นการทำงานในชุมชนหุ่นยนต์ทั้งหมด

ความปลอดภัย: เป็นหัวใจสำคัญในความพยายามด้านวิทยาการหุ่นยนต์ของ TRI โดยออกแบบระบบให้มีการป้องกันด้วยความแข็งแกร่ง ซึ่งขับเคลื่อนโดย Drake และชุดควบคุมหุ่นยนต์แบบกำหนดเองของ TRI เพื่อให้แน่ใจว่าหุ่นยนต์คำนึงถึงการรับประกันด้านความปลอดภัย เช่น การไม่ชนกับตัวมันเองหรือสภาพแวดล้อมของมัน

ที่มา: Toyota Research Institute

About pawarit

Check Also

การ์ทเนอร์เผยปี 2569 ดาต้าเซ็นเตอร์ทั่วโลกจะใช้ไฟฟ้าพุ่งขึ้น 26% [PR]

การ์ทเนอร์ อิงก์ บริษัทผู้ให้คำปรึกษาและวิจัยข้อมูลเชิงลึกด้านธุรกิจและเทคโนโลยี คาดการณ์ว่า ปริมาณการใช้ไฟฟ้าของดาต้าเซ็นเตอร์ทั่วโลกจะเติบโตขึ้นถึง 26% ในปี 2569 นี้ โดยประเมินว่ายอดการใช้ไฟฟ้าของดาต้าเซ็นเตอร์ทั่วโลกในปี 2569 จะเพิ่มสูงแตะ 565 เทราวัตต์ชั่วโมง (TWh) เพิ่มขึ้นจาก …

ครบรอบ 4 ปี สคส. ยกระดับ PDPA ไทยสู่ “โครงสร้างพื้นฐานเศรษฐกิจดิจิทัล”วางเป้า “ข้อมูลรั่วไหลเป็นศูนย์” รับยุค AI สร้างสังคมดิจิทัลที่ปลอดภัยและเชื่อมั่นได้ [PR]

สำนักงานคณะกรรมการคุ้มครองข้อมูลส่วนบุคคล (สคส.) หรือ PDPC จัดงานครบรอบ 4 ปีแห่งการสถาปนาองค์กร ได้รับเกียรติจากรัฐมนตรีช่วยว่าการกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม มอบนโยบายส่งสัญญาณเดินหน้ายกระดับการบังคับใช้กฎหมาย PDPA สู่บทบาทใหม่ ในฐานะ “โครงสร้างพื้นฐานสำคัญของเศรษฐกิจดิจิทัล” ภายใต้ยุทธศาสตร์ “ข้อมูลรั่วไหลเป็นศูนย์” …