谷歌DeepMind推出用於機器人AI模型

【財訊快報/陳孟朔】搜尋引擎巨擘--谷歌(美股代碼GOOG)DeepMind週二發布用於機器人的人工智能模型。新機器人模型名為Gemini Robotics和Gemini Robotic-ER,旨在通過利用大型語言模型的推理能力來完成複雜的現實世界任務,幫助機器人適應複雜的環境。外電報導,Google推出基於Gemini 2.0設計的人工智慧模型,使機器人能夠執行更精細的操作任務。除了公布可用於單一GPU或TPU的「Gemma 3」人工智慧模型,Google DeepMind更以Gemini 2.0模型為基礎,分別推出可用於機器人運作的「Gemini Robotics」與「Gemini Robotics-ER」兩款人工智慧模型,標榜能使機器人執行諸如摺紙、掐緊夾鏈袋等更細膩操作任務。此次推出模型,主要採用視覺、語言、動作合一的「VLA」(vision-language-action)設計,讓機器人透過電腦視覺處理資訊後,在理解語言指令情況下產生細膩執行動作,讓機器人可以更仔細動作完成人類下達指令。