• 强化学习:兵分三路,挺进产业

    2021-04-02 17:34:39 | 热度:

  •  下一个伟大AI技术已经走出实验室。

    编者按:本文来自微信公众号“机器之能”(ID:almosthuman2017);

    不少人对强化学习的印象还停留在打游戏。比如,著名的「阿尔法狗」、Deepmind与OpenAI发布足以击败人类顶级玩家的《星际争霸》和《魔兽争霸2》游戏系统。

    事实上,强化学习系统正从研究实验室过渡到影响力更大的实际应用程序。强化学习可以学习最佳策略以控制大型复杂系统,例如制造工厂,交通控制系统(道路/火车/飞机),金融资产,机器人等。像Wayve 和Waymo这样的自动驾驶汽车公司正使用强化学习来开发汽车控制系统。

    我们已经看到了技术环境变化有多快。几年前,深度学习进入商业领域。如今,30%的高科技和电信公司、以及16%的其他行业的公司都有嵌入式深度学习能力。当高管们理解到强化学习的潜力后,许多组织都会走上类似新西兰酋长队的道路——首先,实现更传统的技术来解决问题,然后,应用强化学习将性能提升到以前无法达到的层次。

    一 卫冕冠军与AI「水手」

    美洲杯帆船赛是国际体育界最古老的赛事之一,也是竞技帆船比赛中最令人垂涎的奖项。美洲杯历来对技术和创新非常重视,每条船都配有计算机模拟器,拥有最好模拟器并最有效地利用它的团队将获得竞争优势。

    美洲杯帆船赛,世界最烧钱的运动之一。

    新西兰酋长队也不例外。2010年,团队建造了当时最先进数字模拟器,在不实际建造的情况下测试船舶设计。这是该团队2017年赢得美洲杯的关键。

    不过,模拟器的局限性也很明显。

    一方面,需要多个水手来优化操作。问题在于,水手们需要训练、旅行和比赛,很难调配更多时间配合优化设计工作。设计师只能在缺乏模拟器性能数据情况下迭代新设计,抢在水手们有时间时,批量测试他们的最佳想法。

    另一方面,水手的表现在不同的测试中可能会有所不同,就像人的表现通常会有所不同一样。设计师很难知道船只反应的微小改善,到底是因为设计调整,还是由于人的测试差异。

    为2021年的比赛做准备时,酋长队大胆设想,如果有一个合格的「AI水手」替代他们操作模拟器就好了。于是,他们与合作伙伴使用强化学习成功地训练了一位AI水手来驾驶模拟器,协助优化关键设计过程。

    比如,水翼。这些翼状结构附着在船体上,使船浮在水面上,可以让船速度超过50节(60英里或100公里每小时),非常重要。

    【分享】

  • 联系方式

    中国 - 深圳

    深圳市前海深港合作区前湾一路1号A栋201室

    商务联系:Business@joway.com

    All Posts
    ×