Покер залиВиж всички

Bwin Poker 40% рейкбек, 10% Rake Chase
VIP
Bet365 Бонус нов играч до €100
VIP
BetKings $1,000 бонус, До 100% рейкбек
VIP
Tigergaming $1,000 бонус, Spin&Run
VIP
ACR $1,000 бонус, Rake Races
27%
Intertops $1,000 бонус, 36% рейкбек
VIP
PokerStars $600 бонус, БЕЗПЛАТНИ $30
VIP
Избор на ЗалаАко се чудите коя от офертите ни да изберете, попълнете формата по-долу и нашия екип ще ви даде компетентното си мнение. Ще ви бъде отговорено бързо и сме сигурни, че нашата помощ ще ви бъде полезна и Вие ще вземете максимума от играта си. Можете да използвате нашия съвет многократно, така че не ни щадете и всеки път, когато се чувствате несигурни в избора си за зала – ние сме насреща. Успех!

Имейл:
Вид игра:
Формат на играта:
Кеш ниво:
Турнирно ниво:
Брой часове седмично:
Брой маси едновременно:
Skype (препоръчително):


Брайън Пелегрино за изкуствения интелект и покера

Бившият покер професионалист обяснява как Дъг Полк победи Даниел Негреану

През ранните дни на Покер бума, Брайън Пелегрино бе може би един от най-добрите хедс-ъп Sit&Go играчи на планетата, тероризирайки опонентите си под името „PrimordialAA.“ Подобно на много други покер професионалисти от своето поколение, той напусна колежа, за да се занимава с покер на пълен работен ден и се справи доста добре, побеждавайки някои от най-високите онлайн лимити.

Той също така направи малък удар в света на турнирите на живо, като направи три дълбоки ръна в WSOP $10,000 Main Event, отбеляза второ място в събитието WSOP $1,500 Pot-Limit Hold’em през 2012 г., и още два дълбоки ръна в WSOP $10,000 No-Limit Hold’em Heads-Up.

Около 2015 г. обаче Пелегрино реши да се оттегли от покера. След едногодишна ваканция, обикаляйки света със съпругата и сина си, Пелегрино се гмурна в компютърния свят. Той създаде модел за машинно обучение, който се фокусира върху последователността на терена, която продаде на Major League Baseball и след това основа крипто бизнес в Силициевата долина.

През 2020 г. обаче компютърният свят го върна към покера. Миналият юли местният жител на Ню Хемпшир помогна за публикуването на изследователска статия с Ноам Браун от отдела за изследвания на изкуствения интелект във Facebook. Документът беше за това как изкуственият интелект може да използва теорията на игрите за усъвършенстване на покер стратегията и да използва същите тези концепции за решаване на проблеми в реалния свят.

Когато Негреану прие предизвикателството, Полк веднага започна да сформира екип, за да усъвършенства цялостната си хедс-ъп игра. Той нае няколко хедс-ъп треньори, които да му помогнат да реализира стратегията по най-добрия възможен начин, група хора, които да създадат база данни с тенденциите на Негреану, и друг екип, който да помогне за циментирането на това, което Полк нарече своята „префлоп стратегия“.

Пелегрино беше привлечен, за да помогне в работата преди флопа. Той се срещна с Card Player, за да обсъдят какво направи зад кулисите с Полк, как неговият изкуствен интелект е подобрение, надминаващо солвър решенията, достъпни за обществеността, и как тази технология може да реши проблеми в реалния свят.

Наскоро Дъг се свърза с теб, за да те привлече към екипа си. Поддържахте ли връзка, докато играеше професионално? Как те намери?

И двамата играехме хедс-ъп. Той играе хедс-ъп кеш, а аз хедс-ъп Sit&Go. В крайна сметка започнах да тренирам с Даниел Кейтс и започнах да работя върху хедс-ъп кеш играта, но никога не съм се впускал дълбоко в тази сцена. Но с изкуствения интелект направихме изследване, а с екипа на Facebook публикувахме академична статия.

Дъг се свърза с мен, за да види дали все още съм активен в играта и общността. Мисля, че той търсеше различно мнение за най-добрите ресурси и най-добрия начин да се подготви за мача. Той е невероятно усърден, повече от всеки друг, когото някога съм познавал. Играл съм покер в продължение на 15 години и не мисля, че съм виждал някой да работи така, както Дъг, по отношение на изучаването, повторението и събирането на всички материали.

И Дъг е много запознат с Ноам Браун, един от хората, които работиха върху изследването. Дъг и неговият екип бяха момчетата, които се бориха с Claudico и Либратус (напреднали покер ботове), така че той знаеше за Ноам и работата му. Казах му, че току-що съм публикувал тази статия с Ноам и че резултатите бяха доста феноменални. Той се интересуваше от това как можем да използваме изследванията в учебния материал.

Какво точно представлява минимизирането на разкаянието? Как това е свързано с покера?

Най-простият начин да го обясним е, че в миналото много хора моделираха решенията, спрямо максимизирането на печалбата. Искате да се опитате да спечелите най-много, нали? Но хората откриха, че това, което всъщност искате да опитате е да намалите разкаянието си.

Това ще ви отведе до Равновесието на Неш. Това ще ви отведе до GTO [оптимална теория на игрите] стратегията. Да приемем, че играем камък, ножица, хартия и аз използвам минимизиране на разкаянието. Ако аз избера камък, а ти ножица, моето разкаяние ще е -1, което означава, че няма да съжалявам. Чувствам се чудесно. Ако избереш камък, ще съм неутрален. А ако избереш хартия, щях да съм с 1. Ще съжалявам.

Така че това, което бих направил, е да използвам това разкаяние за трите резултата, за да променя стратегията си. Така че сега вместо да избирам камък в 100% от случаите, ще го избирам по-рядко, според общото ми разкаяние. И ако направите това трилиони пъти, ще получите GTO стратегия за камък, ножица, хартия.

Същото работи и в покера. Само, че вместо да имате три прости опции, имате гигантско дърво с всеки размер на залога, който хората могат да използват и всяко действие, което могат да предприемат. И целта е да се вземе това дърво и да се намали разкаянието. Ако го направите, ще излезете с GTO стратегия. Стратегия, която никога няма да съжалява за нищо. Опонентът не може да направи нищо, за да ви експлоатира, което ще ви накара да съжалявате много.

Можеш ли да обясниш за какво става дума в изследването на прост език?

Университетът в Алберта и Университетът Карнеги Мелън бяха направили същото изследване, прилагайки изкуственият интелект в покера. Те използваха тези техники, а ние измислихме куп варианти на тези техники. Създадохме нов DCFR+ вариант, нещо като 5000 пъти на общата скорост в сравнение с предишни топ агенти като DeepStack, и играхме с победителя в последния ACPC [Годишен конкурс за компютърен покер], който беше Slumbot.

Всички учени се събират и сформират предизвикателство. Те имат най-новите си покер изследвания и ги използват един срещу друг. И така, взехме победителя от това предизвикателство и играхме. Ние го победихме за 20 големи блайнда в рамките на 100 ръце. Напълно го смачкахме.

Аз не завърших колеж, така че фактът, че публикувам академични статии с изследователския екип на Facebook, означава, че сме направили нещо доста впечатляващо тук. Академичната общност беше страхотна и мисля, че наистина бях впечатлен от резултатите от нашата статия. И нашето изследване беше публикувано точно по времето, когато Дъг обмисляше предизвикателството си с Даниел.

Какво ти каза той, което те накара да се включиш в неговия екип?

Не искам да бъда груб към академичната общност, но наистина е трудно да ни сравняват с други изкуствени интелекти. Свързахме се с всеки друг изкуствен интелект и никой не се интересуваше от сравнителен анализ срещу нас, особено след като работата на някои от тях струва милиони на ден. Slumbot беше публичен и много уважаван.

Но след като публикувахме изследването, нямаше какво друго да правим. Няма да продължаваме по този път на научни изследвания и затова се гмурнахме в много други области… нещо като приложението на технологията. Но когато Дъг се свърза с мен, това беше интересна възможност да видим как може да се учи с изкуствения интелект. Ето шанс това да бъде интегрирано в предизвикателство. В миналото се свързахме с [Фил] Галфонд, за да видим дали той няма да се интересува от нещо подобно, но в крайна сметка това беше просто начин да помогнем на Дъг и потенциално да привлечем малко внимание към самото изследване.

Спомена, че този вид работа може да се използва в други области извън покера. Можеш ли да уточниш къде и как?

Това предизвикателство беше страхотно и публикуването му с Ноам Браун от Facebook AI Research беше огромна чест. Някои от нещата, които изследвахме, бяха автономни превозни средства. Работихме по проблеми с маршрута в самоуправляващите се автомобили и разгледахме и роботиката в оранжериите. Съществуват парникови технологии, които могат да помогнат за създаването на продукция на стойност десетки милиарди долари и как изкуствения интелект може да повлияе на това и да окаже влияние там. Сега проучваме откриването на лекарства. Ние сме очаровани от процеса и сме развълнувани от това, което може да се направи там.

Как се прилага минимизирането на разкаянието за нещо като самоуправляваща се кола?

Ако се опитвате да се движите през тази огромна мрежа и има трафик и всички други неща, които се случват, можете да работите върху този проблем как да стигнете до вашата дестинация с най-малко съжаление. Да приемем, че времето е съжалението и искате да минимизирате времето, необходимо за да стигнете до там. Но не е нужно да е време. Може да е време, може да са пътни условия или пътни такси. Можете да откриете всички тези страхотни приложения в реалния свят.

Дъг каза, че си едно от момчетата, които са помогнали за изграждането на префлоп рейнджа му. Как направи това?

На практика изследването е солвър. Създадохме солвър, който просто е изключително добър и бърз. Съвременният начин на работа на повечето от тези солвъри е, че когато правят префлоп рейнджове, те трябва силно да резюмират резултата.

Така че, можете да изградите скромно префлоп дърво. Не толкова много опции и не толкова голямо или сложно дърво, но тогава ще имате огромен брой флопове и огромен брой търнове. Така че тези дървета стават много големи… стотици терабайта големи. Повече, отколкото бихте могли да поберете на който и да е компютър. И така, това, което трябва да направите е да ги резюмирате. Те разглеждат само 10 флопа или 56 флопа, независимо от подмножеството. И това идва с вашият набор, който сте задали. Трябва да изберете флопове, които се надявате да са представителна извадка и да ви дадат добра картина.

Ние съвсем не правим това. Използваме невронна мрежа, за да отговорим на тези неща. Така че можем да изградим толкова голямо и толкова сложно дърво, което е възможно от човешка гледна точка. Неща, които биха отнели 500 терабайта, които никой съвременен компютър не би могъл да реши, бихме могли да направим за 30 секунди. Това би позволило на Дъг да каже, „Хей, искаме да разберем кой е най-добрият размер на залога, за всеки размер на стака“. Така че нека видим 2x, 2.1x, 2.2x, 2.3x и така нататък. Той може да направи това с всеки размер на стака.

Къде е практично да промените размера? Ами ако Даниел… и помнете, че това е преди да са играли. Ами ако Даниел отвори до този размер? Ами ако лимпне? Дали ще 3-бетне до този размер? Какъв е нашият оптимален размер на 3-бета? Това бяха просто огромен брой изследвания.

Дъг взима тези резултати и ги обобщава и преминава през тях с треньорите си. Това е баланс между това, което е практично и приложението му в реалния свят, защото не можете да имате 57 различни размера и да запомните всичко това. Така че, можете да изберете един или два размера и да решите колко сложна да е стратегията ви и дали си струва или не въз основа на EV (очакваната стойност).

В началото до голяма степен ставаше дума за това. Просто огромен брой изчисления, опитващи се да разберат кои са оптималните размери и как да играем с тях, предполагайки какво би могъл да направи Даниел. Но ако говорите за един от тези други солвъри, налични на пазара, ще ви отнеме една седмица, за да направите всяко от тези изчисления и да получите тези резултати, и това е за малък брой флопове.

Можехме да изкараме 150 от тях за една нощ и просто да имаме огромен доклад сутринта. И точно това се случи. Той се връщаше и казваше, „Хей, това беше интересно. Нека да проучим това повече.“ Той беше в лабораторията, човече. Определено беше в лабораторията.

Какъв беше графикът? Идваше при теб след всеки мач с въпроси или се срещахте в почивните дни между сесиите?

По-голямата част беше работа с неговите треньори. Мисля, че той преминаваше през стратегиите и колко добре се справя с прилагането им. А за нас беше като, „Хей, искаме да проучим това.“ Питахме го какви дървета иска и какво се опитва да измъкне от това. И тогава се връщахме и пускахме всички тези неща и просто му давахме огромен доклад, който да опита и да проучи.

Той не се връщаше и не говореше за конкретни подробности в прилагането на резултатите в играта. Това се случваше главно с треньорския му екип. Нашата работа беше по-скоро да разберем защо се случва нещо. Имало е моменти, в които той е построявал дърво погрешно или е смятал, че нещо е фънки. За нас всъщност ставаше въпрос за това да му предоставим възможно най-много данни.

Негреану беше много отворен да прави промени в играта си с напредването на мача. Трябваше ли да предоставяте данни, конкретно за тези промени? Какво беше усещането за развитието на играта на Негреану от ваша гледна точка?

Определено забелязахме някои от неговите тенденции. Той правеше някои неща, които бяха неща, които никога не трябва да правите. Той флатваше покет поповете и покет дамите, например извън позиция. Имаше всички тези отигравания, които дори не можеха да се считат за смесена стратегия. Те бяха просто неща, които трябва да са на нулата.

Трябваше да разберем от кой свят е изтеглена стратегията му. Откъде вземаше тези неща. Знам, че това не би трябвало да е голяма работа, но беше така, особено имайки предвид, че той стартира наистина добре. Имаше някои неща, които ни караха да си задаваме въпроси.

Той започна да смесва стратегията си с други размери на залога и след като започнаха да играят, виждахме къде променя размера и кога изобщо не го променя. Или си мислехме, че ще използва определен размер за 3-бет, но всъщност той използваше друг. Това беше непрекъснат процес и всеки ден се отхвърляха много рейнджове. Дъг беше просто животно. Искаше да научи повече, искаше да се потопи по-дълбоко.

Да те слушам как говориш за тези неща е изключително интересно, но мислиш ли, че средностатистическия покер играч ще се страхува да играе хедс-ъп покер, след като чуе колко задълбочено протичат някои от тези неща?

В известен смисъл е плашещо, но никой не трябва да се разочарова от това, което е необходимо, за да станеш най-добрият в света. Поглеждате към играч от НБА и вероятно искате да повярвате, че той е естествено талантлив, че всичко, което прави, е да стъпи на корта и да смаже опонентите си, но в действителност той разполагат с огромен екип от хора като диетолози и треньори, конкретни треньори за всичко, което прави.

Всеки, който е елитен в нещо толкова конкурентно като покера, знае, че това изисква все повече и повече работа. Когато започнах през 2002 г., умни момчета се опитваха да се надхитрят един друг. Дори нямаше солвъри. Просто обсъждате теорията с приятелите си. Сигурен съм, че така е изглеждал и баскетболът през 70-те, но нещата се развиват, когато стават все по-конкурентни.

В крайна сметка точно това е необходимо, за да станеш един от най-добрите в света. Защото най-доброто в света сега е много по-добро от това, което е било преди 10 години. По същия начин Стеф Къри и Леброн Джеймс са по-добри в баскетбола от всеки друг в предните поколения.

Повечето хора просто гледат покер играчите, така както гледат спортистите по телевизията. Не виждате лудото количество работа, свързано с натрупването на тези умения и възможността да се състезавате на тези нива.

Свързани новини