Днес компютърът DeepMind AlphaGo победи за трети път световният шампион по Го - кореецът Лий Сидол. Още първата победа стана световна новина.

Какво е Го? Игра на камъчета - нищо повече от това. Фигурите в играта в действителност се наричаг просто "камъни". За разлика от шаха, Го е значително по-проста като правила - 19 по 19 позиции на дървена дъска, върху която поставяш бели и черни камъчета, за да заемаш територия, и можеш да отнемаш вече поставени камъчета, ограждайки ги под прав ъгъл. Който има най-много територия накрая, печели. Това е.

Разбира се, зад простите правила се крие изключителна комплексност на възможните стратегии и тактически подходи. Две са важните разлики на Го от шаха - игра, в която компютрите ни бият вече от десетилетия.

Deep Blue на IBM и Гари Каспаров бяха
доста по-равностойни - компютърът

загуби две игри. 

Първо, в Го имаш доста повече елементи - повече позиции на дъската (19х19 спрямо 8х8), повече камъчета, повече възможни ходове - камъчетата могат да бъдат поставяне абсолютно навсякъде, няма дефинирана територия от началото на играта, както е в шаха. Което означава, че бруталната изчислителна мощ на един компютър трябва да е в пъти повече, ако той разчита на това (именно така Deep Blue победи Гари Каспаров през 1997 г).

Второ - и това е една причина поради която много по-лесно е създаден компютър, който да ни бие на шах - фигурите в Го са равностойни сами по себе си. Нямаш офицери, царици и топове. В шаха, притежанието на няколко ключови фигури е разликата между победата и загубата - и компютрите работят значително по-лесно с тази ясна стойност. В Го стойността на едно камъче зависи от неговата позиция и от позицията на всички останали камъни на дъската. Играта е базирана на схеми на поведение, модели на разположение, много по-комплексни от шахматните позиции.

Лий Сидол е печелил световната титла
18 пъти, а в момента е 2-ри в
ранглистата, но по всичко изглежда,
че няма да разпише и една победа
срещу DeepMind.

Трета разлика, която обаче вероятно няма връзка със загубата на Лий Сидол - Го е по-стара от шаха и се практикува без промени в правилата и много добра култура на записване на стари игри от над 2500 години. Популярна е в източна Азия - Китай, откъдето е тръгнала, Япония и Корея, но интернет я разпространява по цял свят. Професионалните играчи на Го в тези държави са уважавани, обучавани от ранна детска възраст, и отбирани чрез жестоки и тежки състезания. Спортът има изключително добра инфраструктура и в трите държави.

Голямата изненада обаче не бе, че DeepMind победи Лий Сидол - ясно е, че компютрите се развиват изключително бързо и някой ден някой щеше да създаде компютър, който да бие и световните шампиони. Странното е, че досега най-доброто, което компютърна програма по Го е постигала, е да бие силни аматьори. Никога добри професионалисти.

А DeepMind не просто би Сидол - компютърът, по описанието на десетките специалисти, наблюдаващи мачовете, просто разчлени играта на световния шампион и правеше ходове, които професорите по Го описват като "безумни". След втората загуба той каза, че просто се надява да вземе един мач. Остават му само още два шанса.

Как точно DeepMind победи? Компютърът използва не директна изчислителна мощ, за да изчисли най-добрия ход спрямо правилата, заложени в него, а просто прави това, което всички играчи на Го правят - играе. По-точно, със себе си.

Програмистите на DeepMind вкарват в него милиони позиции и действия на истински играчи, които той копира и после прилага срещу леко променена версия на себе си. Това създава възможност компютърът да разгадае следващия ход, да си създаде собствена мрежа от стойности на движенията, да разгледа възможните пермутации, и да избере най-успешните. Това позволява на компютъра да си спести много усилия в това колко бързо намира подходящия ход.

Това означава, че DeepMind няма да свърши прекрасна работа за шах, всъщност - там търсенето на конкретен ход с конкретна фигура е по-печеливша стратегия, в играта няма толкова интуиция, а и днешните програми вече бият шампионите с лекота.

Но начинът на учене на DeepMind е важен и извън Го - той предполага напредък към по-добър изкуствен интелект, по-подходящ за по-интуитивни задачи.