Watson (adimen artifiziala)

Wikipedia(e)tik
Hona jauzi: nabigazioa, Bilatu
Watson superordenagailua

Watson Ameriketako Estatu Batuetako IBM enpresak garatutako adimen artifizialeko sistema informatiko bat da, lengoaia naturalean eginiko galderei erantzuteko gai dena.[1] David Ferrucci ikertzaile nagusiak zuzendutako DeepQA proiektuaren barnean kokatzen da Watson. Izena Thomas J. Watson IBMren sortzaile eta lehen buruaren omenez jarri zitzaion.[2][3]

Watsonek galderei erantzun bat bilatzen die bere datu-base lokal[4] erraldoiari esker, informazioa biltzeko hainbat iturri hartuta: entziklopediak, hiztegiak, berriak, artikuluak, literatura-lanak eta kanpoko datu-baseak. Taxonomia eta ontologiak ere erabiltzen ditu, Dbpedia, WordNet eta Yago hain zuzen.[5]

Watsonen benetako abilezia probatzeko asmoarekin, 2011ko otsailean Estatu Batuetako telebistako Jeopardy! lehiaketan parte hartu zuen , bere aurkariei (Brad Rutter, txapelketaren historian diru gehien irabazi duen parte-hartzailea; eta Ken Jennings, bata bestearen ondoren saio gehien irabazi dituen parte-hartzailea).[6][7] Guztira, Watsonek milioi bat dolar irabazi zuen, eta sari hau World Vision eta World Community Grid karitateen artean banatu zuen IBMk. Rutter eta Jenningsek ere beren sarien (300000 eta 200000 dolar, hurrenez hurren) erdia karitateei eman zieten: lehenak VillageReach-i eta bigarrenak Lancaster County Community Foundation-i.[8]

Nahiz eta Watsonek atal gehienetan gizakiek baino hobeto erantzun, hitz gutxiko pista motzekin arazoak izan zituen. Pista bakoitza jasotakoan, probablitate handiena zuten erantzunak telebista-pantaila batean erakusten zituen Watsonek. Jokoan zehar, 200 milioi eduki-orrialde izan zituen eskuragarri, datu egituratu eta ez-egituratuak, ingelesezko Wikipedia[9] osoa barne, lau terabyte[10] informazio guztira. Watsonek ez zuen Interneterako konexiorik izan lehiaketak iraun zuen bitartean.[11][12]

Sistemaren arkitektura[aldatu | aldatu iturburu kodea]

DeepQAk erabilitako goi-mailako arkitektura, IBMk Watsonerako bereziki erabilia.[13]

Watson question answering sistema bat da, hau da, bere funtzioa erantzunak bilatzea da. IBMk Watson “lengoaia naturalen prozesamendua, informazio bilketa, ezagutzaren errepresentazioa, arrazoiketa automatikoa eta ikasketa automatikoa erantzunen bilaketaren eremu irekian aplikatzen dituen teknologia aurreratuen sistema” bezala deskribatzen du. Watson “IBMren DeepQA teknologia erabiliz eraikia da, hipotesiak sortzeko, probak masiboki biltzeko, analisirako eta kalifikaziorako”.[1]

« Dokumentu bilaketaren eta QA teknologiaren arteko ezberdintasun garrantzitsuena da lehenak hitz-gako bat jasota egokitasunaren arabera sailkatutako dokumentu zerrenda bat itzultzen duela (askotan dokumentu ezagunenak aukeratuz) eta bigarrenak berriz lengoaia naturalean adierazitako galdera bat jasota modu zehatzagoan ulertzen saiatzen dela, erantzun zehatz bat itzuliz.[14]  »
Craig Rhinehart, IBMko negozio estrategia eta merkatu garapen arduraduna

IBMren esanetan, Watsonek ondorengo ezaugarriak ditu:

  • Hardware aldetik, 5 bastidoreko bi kontrol unitate eta laurogeita hamar zerbitzari ditu (bakoitza 3,5 Ghz-ko 8 nukleorekin), guztira 2880 POWER7 prozesamendu nukleo eta 16 TB-eko RAM memoria [15] osatuz.
  • Softwareari dagokionez, DeepQA softwarea erabiltzen du, POWER7 nukleoen prozesamendu masiboki paraleloa aprobetxatuz.[16]
  • Prozesamendu abiadurari dagokionez, Watsonek 500 gigabyte segundoko abiaduran prozesatzen du, milioi bat liburu segundoko prozesatzeko abiadura gutxi gorabehera. [17]

Hardwarearen kostu totala hiru milioi dolar ingurukoa izan zen, Tony Pearson IBMko kontsultore seniorraren esanetan.[18] Informazioa RAM memorian gorde zen txapelketarako, disko gogorren atzipen-abiadura oso motela estimatu zelako.[17] Softwarea Java eta C++ lengoaietan programatu zen, Apache Software Foundation-en Hadoop eta UIMA sistemak erabiliz. Erabilitako sistema eragilea SUSE Linux Enterprise Server 11 izan zen.[10][19][20] Watsonek 100 teknika baino gehiago erabiltzen ditu lengoaia naturala aztertzeko, iturriak identifikatzeko, hipotesiak topatu, sortu, konbinatu eta klasifikatzeko, eta ebidentziak bilatu eta puntuatzeko.[21]

Funtzionamendua[aldatu | aldatu iturburu kodea]

Jeopardy txapelketak ezarritako baldintzak betetzeko, Watson sistemak txapelketako aurkezleak galdera bakoitza irakurri arte itxaron behar zuen, erantzuna erabakitakoan burrunbagailua sakatzeko, sakatzen lehenak erantzuteko aukera lortuz.[12][22] Watsonek testu elektronikoen bidez jasotzen zituen galderak (beste parte-hartzaileek jasotzen zituzten aldi berean)[12] eta, ondoren, lengoaia naturala prozesatzeko hainbat algoritmo martxan jartzen zituen, pistatik ateratako zatiekin bat zetozen esaldiak bere datu-basean estatistikoki bilatuz.[12]Erantzuna eman aurretik, algoritmoetatik jasotako erantzunak datu basearekin konparatzen zituen erantzun horiek baliozkoak ziren ala ez erabakitzeko. Erantzuteko orduan, Watsonek algoritmoetatik jasotako erantzun errepikatuena aukeratzen zuen, aurkezleari ahots elektroniko baten bidez erantzuna emanez. Watsonen indarra ez zen algoritmo berri baten garapena izan, algoritmo asko aldi berean exekutatzeko ahalmena baizik.[12][23]Beste faktore erabakigarri bat erantzute-abiadura azkarra izan zen, gizakiek irabazteko zuten aukera bakarra Watsonek erantzuna entzuten amaitu aurretik erantzutea izan baitzen askotan.[24]

Historia[aldatu | aldatu iturburu kodea]

Watsonen erakustaldi komertzial bat IBMren kabina batean.

Watsonen garapena ekarri zuten baldintzak Deep Blue konputagailuak Gari Kasparov xakeko Nazioarteko Maisu Handiaren aurka 1997ko maiatzaren 11n lortutako garaipenaren ondorioz sortu ziren. IBM, arrakasta honen ondoren, erronka berrien bila hasi zen, 2004an Charles Lickel ikerkuntza kudeatzaileak lagunekin jatetxe batean afaltzen ari zela telebistan Ken Jenning Jeopardy! lehiaketan parte hartzen ikusi zuen arte. Lehiaketa hau IBMrentzako desafio berria bihurtzeko ideia aurkeztu zuen Lickelek, eta 2005ean Paul Horn IBMko ikerkuntza exekutiboak proiektu honetan parte hartzeko bere saileko kide bat konbentzitzeko bere babesa eman zion. Nahiz eta hasieran itxuraz xake jokoa baino askoz ere konplexuagoa zen problema honi heltzeko prest zegoen inor topatzea zaila izan zen, azkenik David Ferrucik eskaitza onartu zuen.[25] Watsonen aurretik Piquant izeneko sistema garatu zuten, zeinak Estatu Batuetako gobernuak antolatutako hainbat lehiaketatan parte hartu zuen, hori bai, jokoko pisten % 35 bakarrik asmatuta eta erantzuteko hainbat minutu behar izanda.[26][27][28] Benetako Jeopardy! Lehiaketan parte hartzeko, Watson segundo gutxian erantzuteko gai izan behar zen, eta une hartan jokoaren problemak ebatzi ezinak zirela ikusi zen.

2006an David Ferruci Analisi eta Integrazio Semantikorako IBMren kudeatzaileak aurrera eramandako probetan Watsonek iraganeko 500 Jeopardy! jokotako pistak jaso zituen. Giza parte-hartzaile onenak pisten % 95i ondo erantzuteko gai zirelarik, lehen proban Watsonek % 15 besterik e zuen asmatu ahal izan. 2007an, Watsonen garapen taldeak problema ebazteko 3-5 urte eta 15 kide beharko zituztela[12] aurreikusi zuen. 2008 urterako, taldeak aurrerapen handiak egin zituen, Watson Jeopardy!-ko txapeldunen aurka lehiatzeko gai izateraino.[12] 2010eko otsailerako, Watson txapeldunak garaitzeko gai zen.[29]

Nahiz eta nagusiki IBMren proiektua izan, Watsonen garapen taldearen parte dira Carnegie Melloneko, Massachusettseko Amhersteko, Kalifornia Hegoaldeko Informazio Zientzietako Institutuko, Texaseko Austingo, Massachussetseko Institutu Teknologikoko (MIT), Trentoko eta Rensselaer Institutu Politekniko Unibertsitateetako hainbat irakasle eta ikasle.

2008an, IBMko ordezkariak Jeopardy!-ko ekoizle exekutibo Harry Friedmanekin harremanetan jarri ziren, Watson eta lehiaketako bi parte-hartzaile arrakastatsuenak ziren Ken Jennings eta Brad Rutteren artean lehiaketa bat aurrera eramateko ideia eztabaidatzeko. Friedman ados egon zen ideiarekin.[12][30] Watsonen eta giza parte-hartzaileen arteko ezberdintasunek gatazka eragin zuten IBMren eta Jeopardy!-ko arduradunen artean lehiaketaren antolakuntzan zehar. IBMk kezka erakutsi zuen gidoilariek galderak egiterako orduan erabil zezaketen moduaren inguruan[31]: izan ere, Watsonen ezaugarri kognitiboak esplotatu zitzazketela iruditu zitzaien, jokoa Turingen Test bat bihurtuz. Arazo hau ekiditeko, hirugarren batek idatzi baina inoiz eman ez ziren saioetako pistak hautatu zituen ausaz.[31] Halaber, Jeopardy!-ko taldeak burrunbagailuaren erreakzio-denboraren inguruan kezka erakutsi zuen: Watsonek hasieran sistema elektronikoa erabiltzen zuen, baina botoia mekanikoki sakatu behar zela erabaki zuten, giza parte-hartzaileek bezala.[32] Edonola, behatz robotikoa erabiliz, Watsonen erreakzio denbora gizakiena baina azkarragoa izan zen. 

Watson prestatzeko helburuarekin, Jeopardy!-ko platoaren simulakro bat eraiki zuten IBMren zentro teknologiko bateko konferentzia gelan. Simulakro hauetan hainbat gizakik, horien artean Jeopardy!-ko txapeldun ohiek, parte hartu zuten[12], eta Watsonek jokoen % 65 irabazi zituen.[33] 

2011ko urtarrilean saio ofizialak grabatu ziren, eta otsailean eman ziren.

Etorkizuneko erabilerak[aldatu | aldatu iturburu kodea]

IBMren arabera, Watsonen helburua konputagailuek gizakiekin elkarrekintza naturala izatea ahalbidetzea da, hau da, gizakien galderak ulertu eta gizakiek ulertu eta justifikatzeko moduko erantzunak ematea, hainbat aplikazio eta prozesu erabiliz.[29]

IBM eta Nuance Communications Inc. ikerkuntza proiektu bateratua aurrera eramaten ari dira, 18 eta 24 hilabete bitartean diagnostikoan eta tratamenduan laguntzeko erabaki klinikoetarako sistema laguntzaile komertzial bat garatzeko. Columbiako Unibertsitateko medikuak medikuntzaen praktikan arazo kritikoak identifikatzen laguntzen ari dira, Watsonek non lagun dezakeen erabakitzeko helburuarekin. Marylandeko Unibertsitatekoak berriz Watson bezalako sistema teknologiko batek medikuekin ahalik eta elkarrekintza emankorrena izateko modua zein izan daitekeen aztertzen ari dira.[34] IBMko kontseilari nagusi Robert C. Weberrek Watson lege-ikerketetan erabil litekeela ere proposatu du.[35]

Watsonek 2010eko otsailetik eskuragarri dauden IBM Power 750 zerbitzariak erabiltzen ditu. IBMk hainbat milioi dolarreko prezioa duen DeepQA softwarea korporazio handiei saltzeko asmoa ere badu. Izan ere, Watson exekutatzeko baldintza minimoak dituen zerbitzari baten prezioa milioi bat dolarrekoa da, nahiz eta IBMk hamarkada batean, teknologia garatu ahala, prezioak asko jaitsiko direla aurreikusten duen.[12]

Ikus, gainera[aldatu | aldatu iturburu kodea]

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. a b   DeepQA Project: FAQ, IBM Corporation, http://www.research.ibm.com/deepqa/faq.shtml. Noiz kontsultatua: 2011ko otsailaren 11 .
  2.   Hale, Mike (2011ko otsailaren 8a), «Actors and Their Roles for $300, HAL? HAL!», The New York Times, http://www.nytimes.com/2011/02/09/arts/television/09nova.html .
  3.   The DeepQA Project, Research.ibm.com, http://www.research.ibm.com/deepqa/deepqa.shtml. Noiz kontsultatua: 2011ko otsailaren 18a .
  4. «Zer da ‘Watson’ bideoa (ingelesez)
  5. http://www.aaai.org/Magazine/Watson/watson.php
  6.   Markoff, John (2009ko apirilaren 27a), «Computer Program to Take On 'Jeopardy!'», The New York Times, http://www.nytimes.com/2009/04/27/technology/27jeopardy.html. Noiz kontsultatua: 2009ko apirilaren 27a .
  7.   Loftus, Jack (2009ko apirilaren 26a), IBM Prepping Soul-Crushing 'Watson' Computer to Compete on Jeopardy!, Gizmodo, http://gizmodo.com/#!5228887/ibm-prepping-soul+crushing-watson-computer-to-compete-on-jeopardy. Noiz kontsultatua: 2009ko apirilaren 27a .
  8.   World Community Grid to benefit from Jeopardy! competition, World Community Grid, 2011ko otsailaren 4a, http://www.worldcommunitygrid.org/about_us/viewNewsArticle.do?articleId=148. Noiz kontsultatua: 2011ko otsailaren 19a .
  9.   Zimmer, Ben (2011ko otsailaren 17a), The Atlantic, http://www.theatlantic.com/technology/archive/2011/02/is-it-time-to-welcome-our-new-computer-overlords/71388/. Noiz kontsultatua: 2011ko otsailaren 17a .
  10. a b   Jackson, Joab (2011ko otsailaren 17a), IBM Watson Vanquishes Human Jeopardy Foes, PC World, http://www.pcworld.com/businesscenter/article/219893/ibm_watson_vanquishes_human_jeopardy_foes.html. Noiz kontsultatua: 2011ko otsailaren 17a .
  11.   Raz, Guy (2011ko urtarrilaren 28a), National Public Radio, http://www.npr.org/2011/01/08/132769575/Can-A-Computer-Become-A-Jeopardy-Champ .
  12. a b c d e f g h i j   Thompson, Clive (2010ko ekainaren 16a), Smarter Than You Think: What Is I.B.M.’s Watson?, The New York Times Magazine, jatorrizkotik artxibatutakoa 30 de noviembre de 2015(e)an, https://www.nytimes.com/2010/06/20/magazine/20Computer-t.html. Noiz kontsultatua: 2011ko otsailaren 18a .
  13.   Ferrucci, D., et al. (2010), Building Watson: An Overview of the DeepQA Project, 31, AI Magazine, jatorrizkotik artxibatutakoa 2015eko azaroaren 30a(e)an, http://www.stanford.edu/class/cs124/AIMagzine-DeepQA.pdf .
  14.   Rhinehart, Craig (2011ko urtarrilaren 17a), 10 Things You Need to Know About the Technology Behind Watson (Entrepreneurial and Intrapreneurial Insights), http://craigrhinehart.com/2011/01/17/10-things-you-need-to-know-about-the-technology-behind-watson/. Noiz kontsultatua: 2016ko urtarrilaren 10a .
  15. Watsoni buruzko FAQak (ingelesez)
  16.   Is Watson the smartest machine on earth?, Computer Science and Electrical Engineering Department, UMBC, 2011ko otsailaren 10a, http://www.cs.umbc.edu/2011/02/is-watson-the-smartest-machine-on-earth/. Noiz kontsultatua: 2011ko otsailaren 11 .
  17. a b   Rennie, John (2011ko otsailaren 14a), How IBM’s Watson Computer Excels at Jeopardy!, PLoS blogs, http://blogs.plos.org/retort/2011/02/14/how-ibm%E2%80%99s-watson-computer-will-excel-at-jeopardy/. Noiz kontsultatua: 2011ko otsailaren 19a .
  18.   Lucas, Mearian (2011ko otsailaren 21a), Can anyone afford an IBM Watson supercomputer? (Yes), Computerworld, http://www.computerworld.com/s/article/9210381/Can_anyone_afford_an_IBM_Watson_supercomputer_Yes_?taxonomyId=67&pageNumber=2. Noiz kontsultatua: 2011ko otsailaren 21a .
  19.   Takahashi, Dean (2011ko otsailaren 17a), IBM researcher explains what Watson gets right and wrong, VentureBeat, http://venturebeat.com/2011/02/17/ibm-researcher-explains-what-watson-gets-right-and-wrong/. Noiz kontsultatua: 2011ko otsailaren 18a .
  20.   Novell (2011ko otsailaren 2a), Watson Supercomputer to Compete on 'Jeopardy!' -- Powered by SUSE Linux Enterprise Server on IBM POWER7, The Wall Street Journal, jatorrizkotik artxibatutakoa 2015eko azaroaren 30a(e)an, http://online.wsj.com/article/PR-CO-20110202-906855.html. Noiz kontsultatua: 2011ko otsailaren 21a .
  21. Watson – A System Designed for Answers
  22.   Libresco, Leah Anthony (2011ko otsailaren 21a), A Non-Trivial Advantage for Watson, The Huffington Post, http://www.huffingtonpost.com/leah-anthony-libresco/a-nontrivial-advantage-fo_b_825837.html. Noiz kontsultatua: 2011ko otsailaren 21a .
  23.   Will Watson Win On Jeopardy?, Public Broadcasting Service, 2011ko urtarrilaren 20a, jatorrizkotik artxibatutakoa 30 de noviembre de 2015(e)an, http://www.pbs.org/wgbh/nova/tech/will-watson-win-jeopardy.html. Noiz kontsultatua: 2011ko urtarrilaren 27a .
  24.   Gondek, David (2011ko urtarrilaren 10a), IBM, http://ibmresearchnews.blogspot.com/2010/12/how-watson-sees-hears-and-speaks-to.html. Noiz kontsultatua: 2011ko otsailaren 21a .
  25.   Baker, Stephen (2011), Final Jeopardy: Man vs. Machine and the Quest to Know Everything, Boston, Nueva York: Houghton Mifflin Harcourt, 6–8. orrialdeak, ISBN 0547483163 .
  26.   Baker, Stephen (2011), Final Jeopardy: Man vs. Machine and the Quest to Know Everything, Boston, Nueva York: Houghton Mifflin Harcourt, 30. orrialdea, ISBN 0547483163 .
  27.   Radev, Dragomir R. (2000), Ranking potential answers to natural language questions(Proceedings of the 6th Conference on Applied Natural Language Processing), http://clair.si.umich.edu/~radev/papers/anlp00.pdf .
  28.   Prager, John (2000ko uztaila), Question-answering by predictive annotation(Proceedings, 23rd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval), http://clair.si.umich.edu/~radev/papers/sigir00.pdf .
  29. a b   Brodkin, Jon (2010eko otsailaren 10a), IBM's Jeopardy-playing machine can now beat human contestants, Network World, http://www.networkworld.com/news/2010/021010-ibm-jeopardy-game.html?hpg1=bn. Noiz kontsultatua: 2011ko otsailaren 19a .
  30.   Stelter, Brian (2010eko abenduaren 14a), I.B.M. Supercomputer 'Watson' to Challenge 'Jeopardy' Stars, The New York Times, http://mediadecoder.blogs.nytimes.com/2010/12/14/i-b-m-supercomputer-watson-to-challenge-jeopardy-stars/. Noiz kontsultatua: 2010eko abenduaren 14a,
    Aipua: «An I.B.M. supercomputer system named after the company's founder, Thomas J. Watson Sr., is almost ready for a televised test: a bout of questioning on the quiz show "Jeopardy." I.B.M. and the producers of "Jeopardy" will announce on Tuesday that the computer, "Watson," will face the two most successful players in "Jeopardy" history, Ken Jennings and Brad Rutter, in three episodes that will be broadcast Feb. 14–16, 2011.»
     .
  31. a b   Needleman, Rafe (2011ko otsailaren 18a), Reporters' Roundtable: Debating the robobrains, CNET, http://chkpt.zdnet.com/chkpt/1pcast.roundtable/http://podcast-files.cnet.com/podcast/cnet_roundtable_021811.mp3. Noiz kontsultatua: 2011ko otsailaren 18a .
  32.   Baker, Stephen (2011), Final Jeopardy: Man vs. Machine and the Quest to Know Everything, Boston, Nueva York: Houghton Mifflin Harcourt, 171. orrialdea, ISBN 0547483163 .
  33.   Sostek, Anya (2011ko otsailaren 13a), Human champs of 'Jeopardy!' vs. Watson the IBM computer: a close match, Pittsburgh Post Gazette, http://www.post-gazette.com/pg/11044/1125163-96.stm. Noiz kontsultatua: 2011ko otsailaren 19a .
  34.   Wakeman, Nick (2011ko otsailaren 17a), IBM's Watson heads to medical school, Washington Technology, http://washingtontechnology.com/articles/2011/02/17/ibm-watson-next-steps.aspx. Noiz kontsultatua: 2011ko otsailaren 19a .
  35.   Weber, Robert C. (2011ko otsailaren 14a), Why 'Watson' matters to lawyers, The National Law Journal, http://www.law.com/jsp/nlj/PubArticleNLJ.jsp?id=1202481662966&slreturn=1&hbxlogin=1. Noiz kontsultatua: 2011ko otsailaren 18a .