从电玩到围棋,不懂规则也都能精通!deepmind公布最新ai技术 – 十轮网-九游会官网真人游戏第一品牌

2016年,alphago战胜韩国棋王李世乭,向全世界宣示了ai在游戏领域的强悍实力。如今deepmind又更上一层楼,向公众介绍不必知晓规则,也能精通各式游戏的ai模型muzero,并有望用于降低youtube的运营成本。

muzero懂得游玩数十款雅达利(atari)电玩游戏、西洋棋、围棋及日本将棋,不过与它的前辈不同的是,以往没有一款ai能够同时精通电玩与棋盘类游戏,且即使不告知它游戏规则,也能在过程中自行领悟。

deepmind曾于2019年首度披露muzero的存在,但直到本周才正式于《自然》期刊上,发布论文介绍这项ai技术的细节。deepmind指出,muzero在各式游戏中都有顶尖表现,并展现出对未知环境的掌握能力。

懂得自行学习游戏规则,muzero能以有限信息做出最佳决策

“我们只是告诉系统说,用你自己构建的认知,去了解这个世界怎么运行。”deepmind计算机科学家大卫.希弗(david silver)表示,“只要内部的理解成功对上了某个现实事物,那我们就满意了。”

根据deepmind披露的信息,muzero的运行方式是为它所游玩的游戏创建一个模型,然后依照模型规划出游戏中最好的策略、下一步,然后通过游玩不断优化这个模型。

muzero的设计理念是考虑到现实应用环境,算法不必全盘了解所有规范、准则,并创建一个100%准确的模型,而是需要在有限的信息下,达到“够用”的程度。

与前辈alphago、alphazero相比,muzero能够在没被告知游戏规则的情况下,精通各式游戏。

例如,在瞬息万变的电玩游戏中,ai没有充足时间解析所有可能性,但在小精灵这类游戏中,即使只从6、7种选择中找出最佳路径,muzero依旧能取得非常好的成绩;而在下围棋时,muzero也能以较少的运算量,达到比alphazero更好的结果。

deepmind解释,具体来说muzero会对依照三种环境要素创建模型,一是当前位置、状况的好坏,二是最好的下一步是什么,三是最后的结果如何。如同搭建一幅树状图般,ai利用深度学习理解各个行动最后会有怎样的结果。

muzero有办法从数个可能选项中,找出最好的下一步怎么走。

希弗指出,“现实世界非常复杂混乱,没有一本手册告诉我们他是怎么运行的,但人类却可以规划出接下来该怎么做。”若以deepmind的举例来说,当看到乌云密布的天空,预测有下雨的可能性,就会决定携带雨伞出门。

“这是我们首次拥有一个有办法创建自己对世界的见解,据此做出复杂前瞻性决策的系统。”希弗提到,“(ai)可以从完全没有先备知识的条件下开始,经由反复测试学习世界规则,并展现出超越人类的表现。”

压缩视频比当代技术更厉害,muzero有望用于降低youtube运营成本

由于是如此突破性的ai技术,deepmind也持续寻找它适合担纲的工作,目前表现最好的是视频压缩,用类似muzero的算法实验后发现,它的表现比以往最好的压缩法节省5%网络流量。

希弗解释,网络上资料流量绝大部分是由视频贡献,倘若能够有效压缩视频,便可缩减经营成本。根据思科的资料,预估到2022年时,视频将占据全球82%的网络流量。

英国媒体《bbc》指出,muzero找到的新视频压缩方式,也有望用于降低youtube的运营成本,不过deepmind暂时不愿透露google何时会利用这项技术,仅声称明年会有更多细节公布。

视频已占据全球网络流量的大多数,《bbc》认为,youtube有望利用muzero的压缩视频技术,节省运营成本。

不单用于视频压缩上潜力无穷,muzero也被认为有助于打造虚拟管家、机器人,甚至强化前阵子deepmind宣布取得突破性进展的蛋白质折叠预测能力。

deepmind一直渴望利用ai对世界做出贡献,muzero能够依照有限信息做出最佳判断的能力,是ai走出屏幕进入现实的重要里程碑。就如他们提到的,“知道撑伞能让你免于淋湿,比分析空气中的雨滴模型更有价值。”

发表评论