gretesek a mlytanulst segt szoftverek - Beszdfelismerstl a gygyszermolekulkig
MTI Sajtadatbank 2012.12.22. 09:25
A mestersges intelligencia technikjnak megalkotst eredetileg az agy klnbz mintafelismersi kpessgeit ler elmletek ihlettk, az erre szakosodott cgek pedig egyre-msra megdbbent eredmnyekrl adnak szmot olyan vltozatos terletekrl, mint a szmtgppel segtett lts, a beszdfelismers vagy a gygyszerkutatsban nlklzhetetlen, gretes j molekulk azonostsa. Ez az elretrs szles krben kivltotta azoknak a kutatknak a lelkesedst is, akik az emberi tevkenysgeket - mint a lts, halls s gondolkods - modellez szoftverek tervezsvel foglalkoznak. Munkjuk nyomn olyan gpek jnnek ltre, amelyek beszlgetnek az emberekkel, autt vezetnek vagy gyrakban dolgoznak helyettk - utbbi esetben jcskn fokozva azokat az aggodalmakat, amelyek arra plnek, hogy az automatizlt robotok sok terleten teljesen kiszorthatjk az emberi munkavllalkat.
ttrs a sebessg s a pontossg tern
Az gynevezett mlytanulsi technolgia nhny szolgltatst tekintve mr a gyakorlatban is vizsgzott. Ilyen pldul az Apple cg Siri nev virtulis szemlyi asszisztense, amely a Nuance Communications beszdfelismersi szolgltatsra pl, vagy a Google Street View, amely a gpi ltst hasznlja fel egy adott cm azonostsra.
Az elmlt hnapok igazi jdonsga azonban a mlytanulsi programok jcskn megnvekedett sebessge s pontossga (a mlytanulsi programokat gyakran mestersges neurlis hlzatoknak, illetve rviden csak neurlis hlknak is nevezik, utalva az agy neurlis kapcsolataira val hasonlsgra).
"Szmos lenygz j eredmny szletett a mlytanulsi mdszerek terletn - nyilatkozta a The New York Times cm lapnak Yann LeCun, egy, a New York-i Egyetemen dolgoz szmtgptuds, aki a Bell Laboratoriesnl a kzrsfelismers egyik ttr kutatja volt. - Rendkvl ritkn lehet tapasztalni ilyen fok nagysgrendbeli ugrst e rendszerek pontossgban."
A mestersges intelligencia kutati ugyanakkor tisztban vannak a tlzott optimizmus jelentette veszlyekkel is: szmos alkalommal volt mr arra plda, hogy a rosszul idztett lelkesedst a terlet feltn mlyreplse kvette.
Az 1960-as vekben nhny szmtgpes szakember gy vlte, hogy alig 10 ven bell elkszlhetnek a mkdkpes mestersgesintelligencia-rendszerek, aztn ezt az 1980-as vekben a kereskedelmi start-up cgek sszeomlsnak hullma kvette.
Versenyben a hatsos gygyszerkomponensekrt
A legutbbi eredmnyek azonban a szmtgpes szakemberek legszlesebb tbort is lenygztk.
Oktberben pldul a Toronti Egyetem vgzs hallgatibl ll csapat - a szmtgptuds Geoffrey E. Hintonnel kiegszlve - fdjat nyert a Merck ltal szponzorlt, j gygyszerek kifejlesztshez szksges molekulk felfedezst elsegteni hivatott szoftverek versenyben.
Egy tbb ezernyi, klnbz molekula kmiai szerkezett ler adathalmazra tmaszkodva mlytanulsi szoftvert hasznltak. Azt igyekeztek meghatrozni, hogy melyik molekula esetben a legvalsznbb, hogy hatsos gygyszerkomponens lehet belle.
Az eredmny azrt is volt klnsen ltvnyos, mert a csapat az utols pillanatban dnttte el, hogy egyltaln elindul a versenyen. Radsul a szoftver sem rendelkezett semmifle specilis tudssal azzal kapcsolatban, hogy miknt ktdnek a molekulk kivlasztott cljaikhoz. Emellett a toronti dikok viszonylag kis mennyisg adattal dolgoztak, jllehet a neurlis hlk ltalban csak gigantikus adathalmazokra ptve teljestenek jl.
"Ez tnyleg llegzetelllt eredmny! Els alkalommal fordul ugyanis el, hogy a mlytanuls mdszere gyztesnek bizonyul, s ami mg fontosabb, hogy ezt egy olyan adathalmazra alapozva sikerlt elrni, amelyen egyltaln nem lehetett kiugr eredmnyben remnykedni" - lelkendezett Anthony Goldbloom, az adattudomny terletnek versenyeit - gy a Merck versenyt is - szervez Kaggle alapt vezrigazgatja.
Marketing s bnldzs
A mintafelismers terletn elrt eredmnyek ugyanakkor nem csupn a gygyszerfejlesztsre lesznek nagy hatssal, hanem egy sor ms alkalmazsi krnyezetre is, idertve a marketinget s a bnldzst. A marketingesek pldul jval nagyobb pontossggal tudjk majd szrni a nagy adatbzisok tartalmt, amikor a felhasznlk vsrlsi szoksait igyekeznek minl preczebben feltrkpezni. Az arcfelismersre gyakorolt hats eredmnyeknt pedig valsznleg jval olcsbb vlhat - s ezltal jval szlesebb krben terjedhet el - a megfigyelsi technolgia.
A mestersges neurlis hlzatok gondolati gykerei egszen az 1950-es vekig nylnak vissza, amikor is azt a folyamatot igyekeztek modellezni, amelynek sorn az agy rtelmezi az informcikat, s tanul bellk. Az utbbi vtizedekben a 64 ves Geoffrey E. Hinton klnsen hatkony j mdszereket dolgozott ki a mestersges hlzatok mintafelismersnek segtshez (Hinton "mellesleg" az k-k-unokja a 19. szzadi matematikus George Boole-nak, akinek a munkja megalapozta a mai digitlis szmtgpek mkdsnek logikjt).
A modern mestersges neurlis hlzatok bemenetekre, rejtett rtegekre s kimenetekre osztott, szoftverkomponensek alkotta tmbkbl tevdnek ssze. A tmbket "trenrozni" lehet a mintk - pldul kpek vagy hangok - ismtelt felismertetsvel.
Lekrzve az emberi elmt
Tavaly pldul egy, a Lugani Egyetem mestersgesintelligencia-laboratriumnak kutati ltal elksztett program egy alakfelismersi verseny sorn nem csupn kt konkurens szoftverrendszernl teljestett jobban, hanem a hs-vr szakrtknl is, amikor egy adatbzisban a nmet kzlekedsi jelztblkat kellett azonostani.
A gyztes program egy 50 000 elembl ll kpsor esetben 99,46 szzalkos pontossggal teljestett, mg a legtbb pontot elrt, 32 ember alkotta csoport 99,22 szzalkos eredmnyt rt el, az tlagos emberi felismersi pontossg pedig 98,84 szzalk volt.
Idn nyron Jeff Dean, a Google mszaki szakembere s Andrew Y. Ng, a Stanford Egyetem szmtgptudsa egy 16 000 szmtgpbl ll klasztert hozott ltre 14 milli fnykp felismershez (ezek egy knyvtr 20 000 klnbz elemt brzoltk). Br a pontossg mrtke viszonylag alacsony volt - 15,8 szzalkos -, a rendszer gy is 70 szzalkkal jobbnak bizonyult legfejlettebb eldjnl.
Oktberben pedig egy Tiencsinben megtartott konferencin a mlytanuls mg merszebb formban mutatkozott be. Richard F. Rashid, a Microsoft vezet szakrtje tartott eladst egy hatalmas, barlangszer teremben, mikzben egy szmtgpes program felismerte az ltala kimondott szavakat, s egyidejleg meg is jelentette azokat angol nyelven az elad feje fltt elhelyezett nagy kpernyn.
Olyan nyelven szlalt meg, amelyen sohasem beszlt
Ekkor eljtt egy olyan fordulat a bemutat sorn, amelyet dbbent, dbrg taps kvetett: az elad minden mondat utn rvid sznetet tartott, szavai pedig mandarin nyelven, knai karakterekkel jelentek meg a kijelzn, a sajt hangja ltal ksrve. Vagyis Rashid egy olyan nyelven "szlalt meg", amelyen sohasem beszlt.
A bravrt rszben a mlytanulsi technolgia tette lehetv, amely a beszdfelismersi pontossg hatalmas javulst eredmnyezte.
Rashid - aki a Microsoft vilgmret kutatsi szervezett felgyeli - elismerte, hogy mikzben a vllalat j beszdfelismer szoftvere 30 szzalkkal kevesebb hibt vt, mint a korbbi modellek, mindez "mg messze van a tkletestl".
"A korbbi minden negyedik-tdik helyett most csupn minden hetedik-nyolcadik sz felismerse hibs" - rta a Microsoft weboldaln. Mindazonltal hozztette, hogy ez volt a "legdrmaibb vltozs a pontossg tern" 1979 ta, "s ahogy mg nagyobb mennyisg adaton vgezzk a trninget, vlheten egyre jobbak lesznek az eredmnyek is".
Az egyik "titok": nincsenek szakmai belharcok
Igen figyelemremlt vonsa a Hinton vezette kutatsnak, hogy csupn elvtve fordulnak el a high-tech terleteken ltalnos szabadalmi korltozsok, s a szellemi tulajdonjogok feletti keser belharc sem jellemz.
"Idejekorn eldntttk, hogy nem pnzt akarunk keresni ezzel a kutatssal, hanem arra treksznk, hogy a lehet legszlesebb krben elterjesszk a technolgit - nyilatkozta. - s ezzel valamennyi kzremkd cg borzasztan elgedett is."
Majd arra utalva, hogy a mlytanuls fejldsnek felgyorsulshoz nagyban hozzjrult a fknt grafikus processzorok nvekv szmtsi teljestmnye is, alhzta: a megfelel megkzelts az, hogy nagyszeren alakultak az arnyok. "Alapveten arra kell csak gyelni, hogy nagyobb s gyorsabb legyen az, amit csinlunk - s ettl mr jobb is lesz. Visszafel tekingetni most nincs mirt" - magyarzta
|