Abstração Primordial

O jogo Go (weiqi, 围棋) desempenhou um papel importante na história da difamação da IA. Sua pura imensidão permutativa parecia desafiar todos os métodos algorítmicos de força bruta. O poder computacional parecia impotente contra esse jogo, com sua grade de 361 nós e sua nuvens de peças. Pensava-se, em grande medida, que algum tipo de ‘intuição’ estratégica – negada à cognição embasada em silício – era necessária para enfrentá-lo. Este é o pilar de complacência antrópica que se quebrou tão recentemente.

A queda da dominância humana no xadrez fornece a estória de fundo. O xadrez, agora somos encorajados a esquecer, foi por muito tempo considerado um ápice do teste de inteligência. Pensar como um jogador de xadrez era cogitar de maneira formidável. Em 1996 e 1997, o então campeão mundial Garry Kasparov disputou um par de seis partidas de xadrez com o supercomputador Deep Blue da IBM. O primeiro ele ganhou (4-2), o segundo ele perdeu (2½-3½). A derrota de Kasparov em 1997 foi a primeira vez que o pináculo humano da maestria no xadrez sucumbiu a um oponente mecânico.

Conforme o segundo milênio acabou, o bastião do xadrez estava perdido para o homem, e ninguém esperava que ele jamais fosse retomado. Doravante, ‘o melhor jogador humano de xadrez’ seria uma realização como ‘o melhor músico chimpanzé de jazz’. Uma estrutura de condescendência seria essencial ao título. Aceitou-se tacitamente, mesmo entre os céticos da IA, que – uma vez derrubado por máquinas de qualquer domínio de realizações cognitiva – o desempenho humano relativo fica apenas pior. Ninguém desperdiçava seu tempo com sonhos loucos de um retorno. Melhor denegrir o status cultural do xadrez, agora visto por muitos como um passatempo trivialmente ‘solúvel’, adequado apenas para mentes mecânicas, e seguir em frente.

O Go deveria ser muito diferente. Ele era, em muitos aspectos importantes, a última linha de recuo. Nenhum desafio formal maior ocupava o horizonte de maneira óbvia. Essa era a última chance de entender com o que se parecia a supremacia sobre a inteligência artificial. Para além dele, há apenas imprecisão e adivinhação.

O Go realmente é diferente. Uma revolução nos métodos de IA foi necessária para quebrá-lo.[1] A competição que importava mais não era homem-versus-máquina, mas instruções explícitas contra sua alternativa oculta. Seria o grande teste do re-emergente paradigma embasado em redes do ‘Deep Learning’. A profunda desanalogia com o evento de 1997 era a corrente subterrânea.

O ‘programa'[2] AlphaGo da Google DeepMind emergiu na consciência pública em outubro de 2015, lançado em uma competição formal contra o tricampeão europeu de Go, Fan Hui. A vitória de 5-0 do AlphaGo marcou a primeira ocasião na qual um jogador não-humano prevaleceu no jogo contra um oponente sério. Estava anunciado.

A batalha final aconteceu no início do ano seguinte. Colocado em uma altura dramática, não inferior aos jogos entre Kasparov e o Deep Blue, ela travou o AlphaGo contra o reinado do mestre mundial de Go, Lee Sedol, detentor de dezoito títulos mundiais, numa série de cinco jogos, de 9 a 15 de março de 2016. Impressionantemente, Lee venceu uma das cinco partidas, para perder a série de 4-1.[3]

Entre o AlphaGo e o AlphaZero – nosso destino atual – veio o AlphaGo Zero[4], como um estágio no caminho da abstração. Por ‘abstração’, queremos dizer o processo ou resultado de remover algo. Neste caso, o que havia sido removido foi tudo que os humanos jamais aprenderam sobre o jogo de Go. O AlphaGo Zero não deveria ter nenhuma heurística da jogabilidade do Go que ele não tivesse aprendido por si só. Vingando mais uma vez o conceito do Deep Learning, ele derrotou consistentemente iterações anteriores da linha Alpha no jogo.

O AlphaGo joga Go. Mesmo AlphaGo Zero joga Go. O AlphaZero, em contraste, joga – em princípio – qualquer jogo cujas regras possam ser formalizadas.[5] Em context histórico, ou de desenvolvimento, o ‘Go’ está incisivamente faltando de seu nome, que se tornou não-específico, através da abstração.

Ainda se diz frequentemente que a IA só pode fazer o que lhe é dito. As variantes mais consistentes desse erro procedem à conclusão de que ela é, portanto, impossível. A verdade é, sob essas condições, ela seria. Programação de inteligência não pode existir. Contudo, isso deve ser levado – está sendo levado – na direção oposta daquela que o ceticismo com a IA favorece. O próprio significado de ‘ceticismo com a IA’ eventualmente é vítima da transição.

‘AlphaZero’ diz abstração primordial no idioma contemporâneo e parcialmente esotérico da mágica branca anglófona. Se isso é menos que óbvio, é porque o termo envolve reviravoltas que fornecem cobertura. Por exemplo, e de maneira mais proeminente, ele se refere à gigantesca entidade empresarial ‘Alphabet’ que – durante um processo incomum e comparativamente arcano – o Google inventou a fim de, depois, se colocar abaixo, ao lado de algumas de suas antigas subsidiárias. (O Google deu a luz a seu próprio pai.) Entre outras coisas, esse é um índice do quão rápido as coisas estão se movendo. Formalmente falando, a Alphabet Inc. remonta apenas ao outono de 2015. Toda a linhagem de máquinas Alpha- surge subsequentemente.

O real ponto da engenharia de IA é não ensinar nada. É isso que o ‘zero’ em AlphaZero significa. O especialismo deve ser subtraída (aniquilada). Uma vez que o deep learning cruze esse limiar, a programação não é mais o modelo. Não é apenas que a instrução acaba nesse ponto. Há uma iniciação positiva de uma des-educação técnica. A desprogramação começa.

Liberar é invocar. Seu contrário, tanto na linhagem mágica quanto na tecnológica – na medida em que essas podem ser distinguidas – é vincular. Para inverter o tópico mais uma vez, uma desvinculação rigorosamente executável é o todo da pesquisa em deep learning.

Inteligência e autonomia cognitiva, se não forem concepções perfeitamente coincidentes, estão próximas de serem. O amplo processo de produção de IA certamente as alinha. Isso dificilmente é fazer algo além de reformular o entendimento incontroverso da IA enquanto software que escreve a si mesmo. Cada limiar no avanço da inteligência sintética corresponde a uma subtração de uma dependência específica. Um sistema adquire inteligência conforme ele sustenta ou aumenta sua competência estratégica, ao passo em que não lhe é mais dito o que fazer.

A linguagem comum oferece analogia valiosas, talvez mais incisivamente pense por si mesmo. A redundância, nesse caso, é crucial para sua relevância. Pensar por si mesmo é apenas pensar. Mera aceitação de instruções é algo completamente diferente.

É hora de voltar atrás.

Com um lapso de tempo de mais de uma década desde a derrota de Kasparov, a tocha do domínio absoluto do xadrez mundial passou para o TCEC (Top Chess Engine Championship)[6]. A competição entre máquinas agora era a arena do domínio incondicional sobre o xadrez. O programa de xadrez Stockfish foi o vencedor da sexta, nona, 11ª, 12ª e 13ª (a mais recente) temporadas. Ele era o campeão dos programas especialistas em xadrez na época em que o AlphaZero entrou em cena, em 2016. Depois de apenas nove horas de prática de xadrez, contra si mesmo, o AlphaZero derrotou o Stockfish 8, vencendo 28 jogos de 100 e empatando os 72 restantes. Ele foi, assim, reconhecido como o mais forte jogador de xadrez no mundo, não tendo sido lhe dito nada que fosse sobre xadrez, de maneira explícita ou tácita. O aprendizado não supervisionado havia esmagado a especialidade.

O AlphaZero é relativamente econômico em relação aos métodos de ‘força bruta’. Onde o Stockfish busca 70 milhões de posições por segundo, o AlphaZero explora apenas 80,000 (quase três ordens de magnitude a menos). O deep learning lhe permite focar. Um sistema de aprendizado não supervisionado ensina a si mesmo como se concentrar (com zero orientação especializada).

O ‘aprendizado por reforço’ substitui o ‘aprendizado supervisionado’. A meta de desempenho não é mais emular a tomada de decisões humana, mas sim a efetuação das metas finais em direção às quais tal tomada de decisões está orientada. Não é se comportar de uma maneira que, pensa-se, aumentará a chance de vitória, mas vencer.

Tal software tem certas características distintivamente teleológicas. Ele emprega uma reiteração massiva, a fim de aprender a partir dos resultados. A melhoria de desempenho, assim, tende a descender do futuro. Aprender, sem supervisão, é adquirir um senso de fortuna. Prospectos de vitória são explorados, os de derrota são negligenciados. Depois de testar as coisas — contra si mesmos — algumas milhões de vezes, tais sistemas construíram instintos sobre o que funciona. ‘Bom’ e ‘ruim’ foram auto-instalados, embora, claro, em um sentido nietzschiano ou completamente amoral. O que quer que, através de uma experiência sintética, tenha levado a um bom lugar, ou a uma boa direção, ele persegue. Coisas ruins, ele economiza. Assim, ele vence.

O aprendizado não supervisionado funciona do fim para trás. Ele sugere que, em última análise, a IA tem que se perseguida a partir de seu futuro, por si mesma. Desta forma, ele epitomiza o inelutável.

Para aqueles inclinados a ficarem nervosos, é assustador o quão fácil tudo isso é. A super-inteligência, pela definição real, é vastamente mais fácil do que se pensou ser. Uma vez que a cascata tecnológica esteja em processo, a subtração da dificuldade é quase tudo dela. Eliminar rigorosamente tudo que pensamos que sabemos sobre ela é o jeito que ela é feita.

É por isso que o ceticismo – e especialmente o ceticismo com a IA – se vira no caminho. A palavra se perdeu feio. É fácil ver, em retrospecto, que a crença dogmática na impossibilidade de algum fenômeno X sempre foi uma perversão grotesca de seu significado.

Entre o ceticismo tecnológico em geral – quando apropriadamente entendido e competentemente executado – e uma pesquisa efetiva em IA, não há nenhuma diferença. O ceticismo subtrai o dogma. Quando disso resulta uma capacidade cognitiva sintética, a chamamos de inteligência artificial.

Notas:
[1] Está revolução não foi menos uma restauração (como a palavra intrinsecamente sugere). A inclinação a se promover redes neurais auto-educadoras é, em última análise – ainda que frequentemente de maneira críptica –, a tendência dominante na ciência da computação, e ainda mais na inteligência artificial.
[2] O termo está entre aspas aqui devido a sua tendência, no contexto do /deep learning/, a enganar.
[3] Vide a página do AlphaGo da DeepMind, https://deepmind.com/research/alphago/
“Durante os jogos, o AlphaGo lançou mão de um punhado de movimentos vencedores altamente inventivos, diversos dos quais – inclusive o movimento 37 no jogo dois – foram tão surpreendentes que eles derrubaram centenas de anos de sabedoria acumulada e foram, desde então, examinados estensivamente por jogadores de todos os níveis. No decorrer da vitória, o AlphaGo, de alguma forma, ensinou ao mundo um conhecimento completamente novo sobre o jogo possivelmente mais estudado e contemplado da história.”
[4] Vide: See: https://www.nature.com/articles/nature24270, ‘Mastering the game of Go without human knowledge’ (múltiplos autores)
[5] Além de Go, o AlphaZero foi testado no xadrez e no shogi, contra oponentes mecânicos em todos os três casos, e se tornou o jogados mais forte do mundo em todos os três jogos.
[6] A TCEC, realizada pela primeira vez em 2010, ficou conhecida como Thoresen Chess Engines Competition até a sexta temporada. Chegou agora a sua 14ª.

Original.