Компјутери су научили како да нас преваре и ево зашто је то добро

Аутор фотографије, Getty Images
Пасијанс, шах, Скребл и Го. Једну по једну, компјутери су освојили неке од најпопуларнијих игара на свету.
Сада је на тај списак додат и покер, упркос томе што се играчи често ослањају на блефирање да би победили противнике.
Дванаестог јула, први пут у историји, бот који игра покер по имену Плурибус победио је симултано неколико врхунских људи у најпопуларнијој картарошкој игри: Текас холдему без ограничења.
Ово би могле да буду лоше вести за покераше на интернету, али да ли то може да помогне човечанству у гомили других кориснијих подухвата?
Зашто је покер тежак за компјутере?
Деценијама је покер био сматран „сувише сложеним" за машинско учење.
За разлику од шаха, где све фигуре и потези могу отворено да се виде, покер је игра „несавршених информација" - због скривених карата играчи имају само делимично знање о тренутном стању партије.

Аутор фотографије, CMU
Покер је славан и по блефирању - покушају да се преваре други играчи тако да мисле да стојите боље или лошије него што стварно стојите.
Ови фактори компликовали су начин на који вештачка интелигенција тражи стратегију за добијање игре.
Срушене границе
Али доминација човечанства у покеру је срушена.
Плурибус, ког је направио Ноам Браун, научни истраживач из Фејсбуковог одељења за истраживање вештачке интелигенције, и Туомас Сендхолм, професор компјутерских наука са Универзитета Карнеги Мелон, очигледно су успели да реше оба ова проблема.
У низу хиљада руку против 13 професионалних играча - од којих су сви освојили више од милион долара играјући покер - бот је сваки пут изашао као победник.
Један од Плурибусових противника био је и Дарен Елиас, освајач рекордне четири титуле Светске покер турнеје.

Аутор фотографије, Getty Images
Употребљивост у стварном свету
Зашто научници раде на машинама које ће победити човека?
Укратко: они сматрају да партија шаха или покера може да помогне вештачкој интелигенцији да изврши много сложеније задатке.
„Користимо покер као основу за фундаменталније проблеме: како да направимо вештачку интелигенцију која може да изађе на крај са скривеном информацијом?", рекао је Браун за ББЦ.
„Да би вештачка интелигенција била примењена у стварном свету и имала интеракцију са људима и другим вештачким интелигенцијама, она мора да буде у стању да разуме да други учесници можда виде свет другачије од ње и да можда имају приступ неким другим информацијама."
„Покер је сјајан симулатор за такве врсте изазова", додао је он.

Аутор фотографије, Getty Images
Кад је АлфаГо, који је развила компанија ДипМајнд у власништву Гугла, постао први компјутер који је победио професионалног играча Гоа 2015. године, његови творци су видели његову могућу употребљивост у задацима повезаним са хемијом и инжењерством - потрагом за новим материјалима, на пример.
Браун и Сендхолм, с друге стране, верују да Плурибусово решавање проблема може да има будућу примену у задацима који су толико разнолики као финансијски преговори и навигација аутоматизованих аутомобила, што су све ситуације које укључују много учесника и недостајуће информације.
„Већина животних ситуација су игре несавршених информација", рекао је Сендхолм.

Аутор фотографије, CMU
Како ботови уче
То је далеко од пустих снова за научнике: пре две године, Либратус, још један програм који су направили Браун и Сендхолм, уништио је људске противнике у покерашким играма један на један у једном казину у Питсбургу.
Експерти тврде да стратегија у играма може да се примени на војне симулације а часопис Вајерд је јавио да је Стратеџи робот, специјализована компанија за вештачку интелигенцију коју је основао Сендхолм, закључио уговор вредан 10 милиона долара са америчком војском у августу 2018. године.
„Ботови потенцијално могу много да нас науче о нашем властитом процесу доношења одлука", објашњава математичар Адам Кучарски, аутор књиге „Савршена опклада: Како наука и математика уклањају срећу из коцкања".
„Најбољи ботови за покер уче кроз процес контрафактуалне минимизације кајања - освртања после донесене одлуке и питања: 'шта би било да сам нешто урадио другачије?'"
„Губећи од ботова, мислим да људски играчи могу много да науче о властитом приступу играма", додаје Кучарски.

Аутор фотографије, Getty Images
„E-блеф"
Али како на крају Плурибус успева да блефира?
Е, па Браун и Сендхолм су дали боту да „научи" покер играјући трилион руку против самог себе и накнадним проучавањем властите стратегије.
Вероватније је да ће стратегије употребљене за победе бити коришћене и у будућности.
Једна од тих одлука била је да се улаже кад се има слаба рука да би се противник натерао да одустане - што је управо суштина блефирања.
„Људи живе у убеђењу да је блефирање веома 'људска' особина коју машине не могу да опонашају", каже Браун.

Аутор фотографије, Getty Images
„Али заправо видимо да машине умеју да блефирају и у стварности могу да блефирају боље од човека."
„Плурибус не доживљава блефирање као нешто преварантски или неискрено, само га доживљава као радњу која у неким случајевима зарађује највише новца у случају кад има лошу руку", додаје научник.
Плурибус је успео да изненади и због тога колико „јефтино" ради. Овој вештачкој интелигенцији је било потребно само компјутерских ресурса из „облака" у вредности од 150 долара, према истраживачима са Карнеги Мелона, док се ДипМајнд ослањао на суперкомпјутере састављене од више од 5.000 специјализованих процесора, за које се процењује да су коштали милионе долара.









