从电玩到围棋，不懂规则也都能精通！deepmind公布最新ai技术

2016年，alphago战胜韩国棋王李世乭，向全世界宣示了ai在游戏领域的强悍实力。如今deepmind又更上一层楼，向公众介绍不必知晓规则，也能精通各式游戏的ai模型muzero，并有望用于降低youtube的运营成本。

muzero懂得游玩数十款雅达利（atari）电玩游戏、西洋棋、围棋及日本将棋，不过与它的前辈不同的是，以往没有一款ai能够同时精通电玩与棋盘类游戏，且即使不告知它游戏规则，也能在过程中自行领悟。

deepmind曾于2019年首度披露muzero的存在，但直到本周才正式于《自然》期刊上，发布论文介绍这项ai技术的细节。deepmind指出，muzero在各式游戏中都有顶尖表现，并展现出对未知环境的掌握能力。

懂得自行学习游戏规则，muzero能以有限信息做出最佳决策

“我们只是告诉系统说，用你自己构建的认知，去了解这个世界怎么运行。”deepmind计算机科学家大卫．希弗（david silver）表示，“只要内部的理解成功对上了某个现实事物，那我们就满意了。”

根据deepmind披露的信息，muzero的运行方式是为它所游玩的游戏创建一个模型，然后依照模型规划出游戏中最好的策略、下一步，然后通过游玩不断优化这个模型。

muzero的设计理念是考虑到现实应用环境，算法不必全盘了解所有规范、准则，并创建一个100%准确的模型，而是需要在有限的信息下，达到“够用”的程度。

与前辈alphago、alphazero相比，muzero能够在没被告知游戏规则的情况下，精通各式游戏。

例如，在瞬息万变的电玩游戏中，ai没有充足时间解析所有可能性，但在小精灵这类游戏中，即使只从6、7种选择中找出最佳路径，muzero依旧能取得非常好的成绩；而在下围棋时，muzero也能以较少的运算量，达到比alphazero更好的结果。

deepmind解释，具体来说muzero会对依照三种环境要素创建模型，一是当前位置、状况的好坏，二是最好的下一步是什么，三是最后的结果如何。如同搭建一幅树状图般，ai利用深度学习理解各个行动最后会有怎样的结果。

muzero有办法从数个可能选项中，找出最好的下一步怎么走。

希弗指出，“现实世界非常复杂混乱，没有一本手册告诉我们他是怎么运行的，但人类却可以规划出接下来该怎么做。”若以deepmind的举例来说，当看到乌云密布的天空，预测有下雨的可能性，就会决定携带雨伞出门。

“这是我们首次拥有一个有办法创建自己对世界的见解，据此做出复杂前瞻性决策的系统。”希弗提到，“（ai）可以从完全没有先备知识的条件下开始，经由反复测试学习世界规则，并展现出超越人类的表现。”

压缩视频比当代技术更厉害，muzero有望用于降低youtube运营成本

由于是如此突破性的ai技术，deepmind也持续寻找它适合担纲的工作，目前表现最好的是视频压缩，用类似muzero的算法实验后发现，它的表现比以往最好的压缩法节省5%网络流量。

希弗解释，网络上资料流量绝大部分是由视频贡献，倘若能够有效压缩视频，便可缩减经营成本。根据思科的资料，预估到2022年时，视频将占据全球82%的网络流量。

英国媒体《bbc》指出，muzero找到的新视频压缩方式，也有望用于降低youtube的运营成本，不过deepmind暂时不愿透露google何时会利用这项技术，仅声称明年会有更多细节公布。

视频已占据全球网络流量的大多数，《bbc》认为，youtube有望利用muzero的压缩视频技术，节省运营成本。

不单用于视频压缩上潜力无穷，muzero也被认为有助于打造虚拟管家、机器人，甚至强化前阵子deepmind宣布取得突破性进展的蛋白质折叠预测能力。

deepmind一直渴望利用ai对世界做出贡献，muzero能够依照有限信息做出最佳判断的能力，是ai走出屏幕进入现实的重要里程碑。就如他们提到的，“知道撑伞能让你免于淋湿，比分析空气中的雨滴模型更有价值。”

从电玩到围棋，不懂规则也都能精通！deepmind公布最新ai技术 – 十轮网-九游会官网真人游戏第一品牌