10万客户首选 21年品质追求
您所在的位置:坛果资讯 >> 科技 > OpenAI的机械手“自学”解开三阶魔方的技术

OpenAI的机械手“自学”解开三阶魔方的技术

   2019-10-29 14:33:37   

       

以研究人工智能和机器学习而闻名的Openai公司周二展示了一种能够求解三阶魔方的机械手。这组名为dactyl的机械手是通过使用名为自动领域随机化(adr)和强化学习的新技术来训练的。在过去的dota 2中,由dactyl采用的强化学习算法已经证明它可以对抗人类的对手。

然而,新技术adr通过产生越来越困难的手指训练场景,帮助教导机械手解决古老的问题。自动域随机化方法如下:

Adr始于一个单一的非随机环境,其中神经网络学习如何求解三阶魔方。随着神经网络在任务中变得更好并达到性能阈值,域随机化的数量将自动增加。因为神经网络现在必须学会将它们传播到更随机的环境中,这使得任务更加困难。神经网络继续学习,直到再次超过性能阈值,然后执行更多随机化,然后重复该过程。

该团队认为adr是一个显著的改进,因为逐步困难的训练模拟的建立“将我们从真实世界的精确模型的束缚中解放出来,并使在模拟中学习的神经网络的转移能够应用于真实世界”。最后,在使神经网络适应各种情况后,手指可以熟练地适应各种物理情况,包括手指被捆绑和戴橡胶手套的前景。

值得一提的是,尽管openai去年展示了手指旋转魔方的能力,但解决三阶魔方所需的灵巧性和操作性不可低估。密歇根大学的机器操作员Dmitry berenson称赞了这一壮举:

“这是一个非常困难的问题。旋转魔方零件所需的操作实际上比旋转魔方要困难得多。”

与此同时,麻省理工学院的机器人专家兼教授莱斯利·凯尔布林说:

“我有点惊讶。我以前没想到他们能做这种工作。”

Openai研究人员认为,实验结果提供了强有力的证据,证明同样的技术可以用于制造通用机器人,在未来可以适应各种条件。来自openai的Marcin andrychowicz设想:“我认为这种方法(强化学习)是机器人学中广泛使用的方法。”

与此同时,一些怀疑论者并不完全相信强化学习是这种机器人未来的方法。贝伦森在谈到这个话题时暗示了一种更传统的方法:“到今天结束时,将会有一些学习过程——也许是强化学习。但我认为这些过程实际上应该要晚得多。”

重大专题

  • 5G进行时 三大运营商5G服务预约人数已超千万
  • 科技打卡新地标 山东首所精品移动5G网络校园落户烟台

拟在建|VIP项目

项目聚焦

投资动态

投资政策

行业动态

BHI视点