Pangunahin Mga Serbisyo Sa Pag-Streaming Natutunan ng AI na manloko sa Q * bert sa paraang wala pang tao na nagagawa dati

Natutunan ng AI na manloko sa Q * bert sa paraang wala pang tao na nagagawa dati



Ang isang AI ay pinamamahalaang mandaraya kasama ang pinakamahusay na sangkatauhan na inaalok pagkatapos matuklasan ang isang pagsasamantala sa klasikong arcade game na Q * bert at tumatakbo kasama nito.

Habang ang mga naunang pag-ulit ng AI ay maglalaro nang maayos sa Q * bert, sa ilang mga punto sa pag-aaral nito kung paano gumagana ang laro, natuklasan nito ang isang pagsasamantala na hinahayaan itong mag-ipon ng mga nakakabaliw na puntos. Naturally, tulad ng gagawin ng anumang manlalaro ng iskor-pangangaso, inuulit nito ang proseso upang mapalakas nito ang iskor nito sa pinakamabisang paraan na posible.

Maaari mong makita ang Ai na gumagalaw sa paligid ng mga platform sa video sa ibaba. Sa una, mukhang walang layunin itong paglukso sa pagitan ng mga platform. Sa halip na makita ang pag-usad ng laro sa susunod na pag-ikot, ang Q * bert ay natigil sa isang loop kung saan ang lahat ng mga platform ay nagsisimulang mag-flash - narito ang AI pagkatapos ay maaaring pumunta sa isang marka ng siklab ng galit na nakakakuha ng malaking puntos.

BASAHIN SA SUSUNOD: Ang isa sa mga pinaka-kontrobersyal na tala ng laro ay sa wakas ay na-discredit

kung paano sasabihin kung naka-block ka sa snapchat

Paano nanalo ang AI sa giyerang Q * bert

Sinira ang all-time record para sa pamagat, pinagsama ng AI ang isang imposibleng mataas na marka salamat sa pag-program ng diskarte sa diskarte sa ebolusyon. Ang mga diskarte sa ebolusyon (ES) ay naiiba mula sa karaniwang natutunan na pampatibay (RL) na ginagamit ng tradisyunal na AI dahil nakikita itong mas nasusukat dahil sa pag-aaral ng henerasyon.

Ang bawat loop sa pag-aaral ay tinutukoy bilang isang henerasyon at nagpapatuloy ito sa gawain hanggang sa matugunan ang isang itinakdang kondisyon (sa kasong ito, isang mataas na marka). Sa bawat sunud-sunod na henerasyon, ang AI ay sumisipsip ng kaalaman ng nakaraang henerasyon at samakatuwid ay mas mahusay na makamit ang parehong layunin at malampasan ito. Magpatuloy, at magtatapos ka sa isang AI na ganap na walang katumbas sa gawain nito. Iyon mismo ang nangyari dito sa marka ng Q * bert.

Nakabalangkas sa ang papel , na inilathala noong nakaraang linggo ng mga mananaliksik sa University of Freiburg, Germany, lumalabas na ang bug ay hindi kilalang dami. Sa katunayan, habang hindi sila masyadong nagulat tungkol sa paghahanap ng bug, kagiliw-giliw na makita kung paano natuloy ang AI at natutunan na samantalahin ito sa tuwing naglalaro ito upang ma-maximize ang potensyal na pagmamarka nito.

BASAHIN SA SUSUNOD: Ang artipisyal na katalinuhan na ito ay natututo na makabisado sa Super Mario Bros

Upang hanapin ang bug, kailangang malaman muna ng ahente upang halos makumpleto ang unang antas - hindi ito tapos nang sabay-sabay ngunit gumagamit ng maraming maliliit na pagpapabuti, ipinaliwanag ng mga mananaliksik sa Ang rehistro . Pinaghihinalaan namin na sa ilang mga oras sa pagsasanay ang isa sa mga solusyon sa supling nakatagpo ng bug at nakakuha ng mas mahusay na iskor kumpara sa mga kapatid nito, na kung saan ay nadagdagan ang kontribusyon nito sa pag-update - ang timbang nito ay ang pinakamataas sa bigat na ibig sabihin. Dahan-dahan nitong inilipat ang solusyon sa puwang kung saan mas maraming mga pag-offset ang nagsimulang makaharap sa parehong bug.

Hindi namin alam ang mga tumpak na kundisyon kung saan lilitaw ang bug; posible na lilitaw lamang ito kung ang ahente ay sumusunod sa isang pattern na tila suboptimal, [halimbawa kapag ang ahente ay nag-aksaya ng oras, o kahit na nawalan ng isang buhay]. Kung iyon ang kaso, kung gayon magiging napakahirap para sa karaniwang RL na hanapin ang bug: kung gagamit ka ng mga dagdag na gantimpala matututunan mo ang mga diskarte na mabilis na nagbubunga ng ilang gantimpala, sa halip na matuto ng mga diskarte na hindi nagbubunga ng maraming mga gantimpala at tapos biglang nanalo ng malaki.

Tingnan ang kaugnay Ang kampeon sa Dragster na si Todd Rogers ay nawala lamang ang kanyang korona makalipas ang 35 taon Ang artipisyal na katalinuhan na ito ay natututo na makabisado sa Super Mario Bros 1-2 sa loob ng 17 araw Panoorin ang AI na matuto itong magmaneho sa GTA V sa Twitch

Gayunpaman, sa kabila ng kahanga-hangang mga resulta ng bot, hindi sinasabi ng mga mananaliksik na ito ay isang kaso sa kampeon ng ES na natutunan sa RL. Sa katunayan, ang parehong mga sistema ay may kani-kanilang mga problema at ang isang kumbinasyon ng dalawa ay higit na nakikita bilang pinakamahusay na pagpipilian na sumasabay.

Ang parehong pamamaraan ng ES sa iba pang mga laro ng Atari ay hindi nagdala ng kahit saan malapit sa parehong positibong mga resulta. Sa kabilang banda, responsable ang RL sa pagbasag ng mga record sa kaliwa, kanan at gitna, kabilang ang pagkatalo sa pinakamahusay na manlalaro ng GO sa buong mundo. Ang ES ay mayroon pa ring sariling lugar sa mga bagay, at talagang kung paano gumaganap ang Nvidia ng maraming pagsasanay sa AI dahil dito nangangailangan ito ng higit na lakas sa computational ngunit nakakamit ang mas mahusay na mga resulta sa mas mahabang panahon.

Hindi alintana ng aling paraan ang magiging hinaharap para sa pag-unlad ng AI, hindi bababa sa pagdaraya ng bot na ito ang system ay hindi kasing sama nito disgraced video game champion sa mundo .

Kagiliw-Giliw Na Mga Artikulo

Choice Editor

Paano magsimula ng isang email sa propesyonal
Paano magsimula ng isang email sa propesyonal
Ang pagsubok na magsimula ng isang email sa propesyonal ay hindi simpleng gawain. Ang pagsisimula ng isang email ay magbibigay sa iyo nang harapan nang may pinakamahirap na bahagi kaagad - ang pagpapakilala. Ang mga unang ilang linya ng isang email ay maaaring gumawa o masira, kaya
Paano Itago ang Mga Pahina ng Mga Setting sa Windows 10
Paano Itago ang Mga Pahina ng Mga Setting sa Windows 10
Sa Windows 10, posible na itago ang mga pahina sa Mga Setting. Pinapayagan ka ng isang espesyal na pagpipilian na itago ang ilang mga pahina o ipakita lamang ang mga pahina mula sa isang listahan na iyong ginawa.
Paano Kumuha ng Wraith Knife sa Apex Legends
Paano Kumuha ng Wraith Knife sa Apex Legends
Ang Apex Legends ay isang larong Battle Royale na puno ng mga kawili-wiling sorpresa. Bukod sa pagkakaroon ng malaking mapa, na napakahusay para sa mode na ito ng laro, nagtatago ang Apex Legends ng maraming bihira at eksklusibong item para mahanap ng mga manlalaro. Ang ilang mga item ay mas madali
Paano Maglaro ng 3D Pinball Space Cadet sa Windows 10
Paano Maglaro ng 3D Pinball Space Cadet sa Windows 10
Kung nagamit mo ang isang mas matandang bersyon ng Windows tulad ng Windows 95, Windows XP, Windows ME o Windows 2000, malamang na naaalala mo na mayroong isang laro ng pinball na kasama nang libre sa operating system. Ang laro ay
Paano i-edit ang Google Docs sa Kindle Fire
Paano i-edit ang Google Docs sa Kindle Fire
Ang Google ay gumagawa ng isang kamangha-manghang trabaho ng pagsasama ng lahat ng kanilang mga serbisyo. Gumagawa ang mga ito ng maayos sa bawat isa upang gawing mas madali ang iyong buhay. Gayunpaman, hindi ginugusto ng Amazon ang paglalaro ng maganda sa Google, dahil ang mga ito ay mabangis na kakumpitensya. Dahil ang Kindle Fire ay
Ibalik ang pag-aayos ng mga icon ng Desktop sa Windows 10
Ibalik ang pag-aayos ng mga icon ng Desktop sa Windows 10
Minsan nawala ang pasadyang posisyon ng mga icon ng Desktop at awtomatiko silang nakaayos. Mayroong isang paraan upang maibalik ito nang mabilis. Narito kung paano.
Paano I-clear ang Cache sa Xbox One Console
Paano I-clear ang Cache sa Xbox One Console
Mabagal ang pagtakbo ng Xbox One? I-clear ang cache sa iyong Xbox One console, at maaaring mabigla ka sa kung gaano ito gumagana.