Categorias

Algoritmo AlphaGo Zero aprendeu sozinho a ser o melhor jogador de Go do planeta

Esqueça AlphaGo, a Inteligência Artificial do Google DeepMind que derrotou o campeão mundial de Go. Esqueça também AlphaGo Master, que derrotou online diversos jogadores profissionais de Go.

O novíssimo AlphaGo Zero não apenas foi capaz de se ensinar sozinho a jogar Go a partir do nada como também conseguiu derrotar tanto o AlphaGo Master quanto o AlphaGo principal com pouco mais de um mês de treinamento.

Ao contrário de seus antecessores, AlphaGo Zero não foi alimentado por um vasto banco de dados de movimentos e complexos algoritmos ajustados manualmente por seus desenvolvedores humanos. A nova Inteligência Artificial treinou contra seus irmãos em partidas sucessivas e automáticas, aprendendo com seus erros e acertos ao longo do caminho.

Zero conseguiu agora uma margem de 100 vitórias para zero derrotas contra o mesmo sistema que derrotou o campeão mundial humano na categoria. Em 21 dias de treinamento, venceu também AlphaGo Master. Após somente 40 dias de aprendizado, se tornou capacitado para derrotar com absoluta certeza toda e qualquer versão do AlphaGo criada antes de si mesmo.

Demis Hassabis, CEO e fundador do projeto, explica qual é a diferença fundamental de zero para seus “irmãos” virtuais: “o sistema começa com uma rede neural que não conhece nada sobre o jogo de Go. Em seguida, ele joga jogos contra si mesmo, combinando essa rede neural com um poderoso algoritmo de busca. Esta rede neural atualizada é então recombinada com o algoritmo de busca para criar uma versão nova e mais forte do AlphaGo Zero e o processo começa novamente “.

Sem as limitações do conhecimento humano ou falhas que podem ser cometidas por seus criadores, AlphaGo Zero teve como professor o que Hassabis considera “o jogador mais forte do mundo: o próprio AlphaGo”.

A meta agora é utilizar os mecanismos de aprendizado desenvolvidos e aplicá-los para um modelo genérico de aprendizado, capaz de ensinar qualquer tipo de regra ou sistema para Inteligências Artificiais.