Testu prediktibo

Wikipedia, Entziklopedia askea

Testu prediktiboa dispositibo batean testua sartzeko teknologia bat da, eta tekla edo botoi bakoitzarekin letra asko sartu daitezkeenean erabiltzen da, sakelako telefonoen zenbakizko teklatuetan eta irisgarritasun-teknologietan. Dispositibo txiki batzuetan tekla gutxiagoko teklatuak erabiltzen dira testu-mezu bat, mezu elektroniko bat, helbide-liburu bat, egutegi bat, eta abar idazteko. Testu prediktiboak hitz osoa lortzeko aukera ematen du horrelako teklatu batean, nahiz eta hitzeko letra bakoitzerako tekla-sakatze bakar bat egin; berak asmatuko du sakatze-sekuentzia horrekin zein den idatzi nahi zen hitza. Tekla bidezko sakaketa bakoitzak iragarpen automatiko bat abiarazten du, sakatu den teklako zein letra erabili duen jakitzeko, osatzen ari den hitza zein den asmatzen saiatuta.

Testu mezularitza erabilitako ITU-T E.161 teklatu estandarra

Testu iragarle sistema orokorrenak, T9 , iTap , eZiText , eta LetterWise / WordWise dira. Testua iragartzen duen gailu bat eraikitzeko modu asko daude, baina testu prediktiboko sistema guztiek hasierako hizkuntza-konfigurazioak dituzte, erabiltzaile bakoitzari egokitzeko aurrezpenak eskaintzen dituztenak. Ikaskuntza honek, gailuaren memoriaren bidez, erabiltzailearen desbiderapenezko iritzia moldatzen du, zuzentzaileen tekla sakatuen ondorioz; esate baterako "hurrengoa" tekla sakatuz, asmoa lortzeko. Testu iragarle gehienek erabiltzaileen datu-basea dute prozesu hori errazteko.

Teorikoki, bukatutako eskrituran karaktere bakoitzak eskatzen dituen tekla-pultsazioen kopurua, batez beste, teklatu baten erabilerarekin konparagarria da. Hori gutxi gorabehera horrela da, eta erabilitako hitz guztiak datu-basean badaude, puntuazioa ez da aintzat hartzen, eta ez da kontuan hartzen idazketa edo ortografia hutsegiterik.[1] Praktikan, faktore horiek eraginkortasunaren gaineko bariantza handia eragiten dute. [2] KSPC = 1.00 karaktereko teklatu teoriko bakoitzeko, KSPC teklatu bat eta multipulua KSPC = 2.03 da. Eatoni-ren LetterWise iragazkia multi-tap hibridoa da, eta telefonoaren teklatu estandarraren arabera KSPC = 1.15 lortzen da ingelesez.

Testu prediktiboaren sistema, sistema onena bailitzan erabiltzea erabiltzailearen hobespen interfazearen estiloarekin bat dator, erabiltzailearen testu iragarlea erabiltzeko softwarearen mailarekin eta erabiltzailearen eraginkortasun helburuarekin. Arrisku maila bat baino gehiago dago testu prediktiboko sistemetan, sistema anitzeko sistemekin alderatuta; izan ere, testua automatikoki idazten da, eta abiadura eta eraginkortasun mekanikoa lortzen laguntzen du, eta, erabiltzaileak ez badu berrikusten, informazio okerra transmititzen du. Testu iragarle sistemek ondo erabiltzen ikasteko denbora behar izaten dute, eta, beraz, oro har, erabiltzaileak aukeren artean hautatzeko eta testu iragarle metodo desberdinen artean konfiguratzeko aukera ematen du.

Jatorria[aldatu | aldatu iturburu kodea]

SMS mezu laburrak (SMS) telefono mugikorreko erabiltzaile batek testu mezuak bidaltzeko aukera ematen du (mezuak, SMSak, testuak eta txtak ere deitzen ditu) mezu labur modura. SMS testu-sarrera sistema arruntena " multi-tap " gisa ezagutzen da. Ukipen anitzekoa erabiliz, tekla bat baino gehiago sakatzen da tekla horren letren zerrendara sartzeko. Esate baterako, "2" tekla behin sakatuta "a" bistaratzen da, bitan sakatuta "b" bistaratzen da eta hiru aldiz "c" bistaratzen da. Bi tekla bereko bi letrak sartzeko, erabiltzaileak "hurrengo" botoia sakatu edo itxaron egin behar du. Erabiltzaile batek teklatu alfanumeriko bat sakatuz idatz dezake ekipo elektronikoen pantailan. Horrela, ukitu anitza ulertzeko erraza da, eta begizko atzeraelikadurarik gabe erabil daiteke. Hala ere, ukipen anitzekoa ez da oso eraginkorra,tekla-pultsazio asko eska baititzake letra bakar bat sartzeko.


Testu prediktibo iragankorretan, hitzak erabiltzen diren hizkuntzan daude, puntuazioari ez zaio jaramonik egiten, ortografia akatsik egiten ez bada eta idazketa akatsik egiten ez bada. Hiztegi ezin hobea litzateke slang, izen egokiak , laburdura , URLak , atzerriko hizkuntzen hitzak eta beste erabiltzaile-hitz bakarrak dituena. Egoera ezin hobe honek testu iragazkorraren softwarea ematen dio erabiltzaileari hitza idazteko beharrezko teklak murrizteko. Erabiltzaileak letra bakoitzari dagokion zenbakia sakatzen du, eta testuari aurre egitean dagoen hitza existitzen bada edo hiztegi ez-sistemek behar bezala desamestu badute, agertuko da. Adibidez, "4663" sakatzea "Good" hitza bezala interpretatuko da normalean, beti ere, gaur egun, ingelesezko hizkuntza-datu-base bat erabiltzen bada, nahiz eta "Home", "Hood" eta "hoof" aukerak teklen pultsazio-sekuentziaren baliozko interpretazioak diren.

Testu iragarle gehien erabiltzen dituzten sistemak Tegic T9 , Motorola iTap , eta Eatoni Ergonomia ' LetterWise eta WordWise dira . T9 eta iTap-ek hiztegiak erabiltzen dituzte, baina Eatoni Ergonomia produktuak desambiguazio prozesu bat erabiltzen du, estatistikako arau multzo bat teklen trokelen sekuentzien artean birsortzeko. Testu iragarle sistema guztiek hizkuntza-datu base bat behar dute sarrera-hizkuntzako hizkuntza guztietan.

Hiztegiak vs hiztegirik gabeko sistemak[aldatu | aldatu iturburu kodea]

Desanbiguazio tradizionalak hitz arruntei buruzko hiztegi bat baliatzen du, baina Eatonik hiztegirik gabeko desanbiguazio-sistema bat eskaintzen duen.

Hiztegian oinarritutako sistemetan, erabiltzaileak zenbaki-botoiak sakatzen dituenean, algoritmo batek tekla-konbinazioarekin bat egiten duen hitz posibleen zerrenda bilatzen du eta aukerarik egokiena aukeratzen du. Erabiltzaileak hautapena berretsi eta aurrera egin dezake edo beste konbinazio posibleen artean aukeratu.

Hiztegirik gabeko sistemak hitzak eta beste letra-sekuentzia batzuk eraikitzen ditu hitzen estatistiketatik abiatuta. Oraindik sartu ez diren tekla-pultsazioen emaitza iragartzen saiatzeko, desanbiguazioa hitzak osatzeko zerbitzu batekin konbinatu daiteke.

Bi sistemetako edozeinek (desanbiguazioa edo prediktiboa) erabiltzailearen datu-base bat izan dezake, eta hori "ikaskuntza"-sistema del esan daiteke erabiltzailearen datu-basean hitz edo esaldiak sartzen baitira, erabiltzailearen esku-hartze zuzenik gabe. aurrez hornitutako datu-basearekin ondo desanbiguatu ez diren hitz edo esaldiak erabiltzailearen datu-base horretan gordetzen dira. Desanbiguazio sistema batzuek ortografia zuzendu, testua formateatu edo beste errepresentazio automatiko batzuk ere egiten saiatzen dira; testua sartzeko erabiltzaileak egiten dituen ahaleginak hobetzeko... edo frustratzeko, horretan beti dago arrisku-puntu bat.

Historia[aldatu | aldatu iturburu kodea]

Lin Yutang-ek 1940ko hamarkadan sortutako txinerazko idazmakinak barne hartu zituen karaktere baten ondoan tekleatu beharko zien hurrengo karaktereak asmatzeko iradokizunak. 1951. urtean Zhang Jiying zinemagile txinatarrak txinatar karaktereak antolatu zituen elkartze-klusterretan, testu aurreikuspen modernoaren aitzindaria izan zen eta makinaz idazteko orduko abiadura-markak hautsi zituen.[3] Telefonoaren teklatuaren aurreikuspenen sarrera oso ezaguna izan da 1970eko hamarkadatik aurrera (Smith eta Goodwin, 1971). Testu prediktiboaren alderdi batzuk, esate baterako, Kondraskok (1985) patentatu ditu, eta telefono bidez gorrentzako telefonoz komunikatzeko testu-sistema baten teklatu guztiz funtzionala 1988an patentatu zuen Roy Feinsonek, aurreikuspen modernoen ezaugarri gehienak jaso zituen, desanbiguazioa eta hiztegi lokalaren biltegiratzea barne. Testu prediktiboa telefonoaren gaineko izenen izenak bilatzeko erabili zen gehienbat, telefono mugikorraren testu-mezularitza hedatu zen arte.

Adibidea[aldatu | aldatu iturburu kodea]

Mugikor teklatu ohikoetan, erabiltzaileak the hitza sartu nahi badu, ondorengoa egin beharko du:

  • Sakatu 8 (tuv) behin t hautatzeko.
  • Sakatu 4 (ghi) bi aldiz h hautatzeko.
  • Sakatu 3 (def) bi aldiz e hautatzeko .

Baina, testu iragarlea duen telefono batean, hau besterik ez da egin behar:

  • Sakatu 8 behin lehenengo (tuv) taldea hautatzeko.
  • Sakatu 4 behin bigarren (ghi) taldea hautatzeko.
  • Sakatu 3 behin hirugarren karakterearen (def) taldea hautatzeko.

Sistemak pantaila freskatzen du tekla bat sakatzen den bakoitzean, sarrera probableena erakusteko. Adibide honetan, aurreikuspenek 5 eta hiru bitarteko botoi-sakatze murriztu zuten. Eragina are handiagoa da hitz luzeekin eta letrak gako bakoitzaren sekuentzian osatuta.

Hiztegian oinarritutako sistema batek idatzi nahi den hitza hiztegian dagoela uste du, hori da bere funtzionamenduaren oinarria. Itxaropen hori lekuz kanpo egon daiteke hitzaren erabilera arruntetik desberdina bada —bereziki, hitza ez badago ondo idatzita, jergakoa bada, edo izen propio bat bada. Kasu horietan, beste mekanismo bat erabili behar da hitza idazteko. Gainera, hiztegi sinplearen ikuspegiak euskara bezalako hizkuntza aglutinatzaileekin porrot egiten du.

Konpainiak eta produktuak[aldatu | aldatu iturburu kodea]

Testu-iragarlea hainbat produktuen lehiakorren bitartez garatu eta merkaturatzen da, hala nola, Nuance Communications enpresaren T9. Beste produktuen artean, besteak beste, Motorola iTap , Eatoni Ergonomikaren LetterWise (karakterea, hitzezko iragarpena baino gehiago), WordWise (word-oinarritutako aurreikuspena hiztegirik gabe), EQ3 (QWERTY- like diseinua, telefonoaren teklatu ohikoekin bateragarria); Gailu nagusiak Phraze-It ; Xrgomics ' TenGO (sei tekla QWERTY teklatu murriztua); Adaptxt (hizkuntza, testuingurua, gramatika eta semantika kontuan hartzen ditu); Lightkey (Windows iragazkia idazteko softwarea); Clevertexting (hizkuntzaren izaera estatistikoa, dictionaryless, gako dinamikoen esleipena); eta Oizea Mota (denborazko anbiguotasuna); Intelab Tauto; Wordlogic-en Intelligent Input Platform™ (patentatua, geruza oinarritutako testu iragarpen aurreratuan, hizkuntza anitzeko hiztegi bat, ortografia egiaztatzen duena, Web bilaketa barnean).

Testunimoak[aldatu | aldatu iturburu kodea]

Tekla-sakatzezko konbinazio berarekin sortu daitezkeen hitz desberdinei "testunimo" deitzen zaie (ingelesez textonyms[4], "txtonyms", "T9onyms" ("tynonyms" ahoskatuta)[4]). Testunimo okerra hautatzea akats ortografikorik edo ortografikorik ez dagoenean ere gerta daiteke, aldez aurretik zehaztutako testunimo bat aukeratzen bada edo erabiltzaileak akatsa egiten badu. Lehen aipatu bezala, telefono baten teklatuan, 4663 tekla-sekuentzia, ingelesezko hizkuntza-datu-base batez hornitua, "Good" hitzaren antzekoa izango da. Hala ere, gako sekuentzi bera beste hitz batzuei dagokie, esate baterako, home, gone, hoof, hood, eta abar. Adibidez, "Are you home?" izan daiteke "Are you good?", baldin eta erabiltzaileak hitza 4663 besterik ez badu. Hori gaizki-ulertzeak sor ditzake; esate baterako, 735328 sekuentzia select edo bere antonimo den reject izan daiteke. Horrelako erroreek antza dute ortagrafia zuzentzaileekin gertatzen den Cupertino efektuarekin.

Joko moduan gazte milurteko batzuek testunimo batzuk erabili izan dituzte ingelesez. Belaunaldiko argot gisa erabili dira, eta, adibidez, book hitzaren erabilera cool adierazteko erabiltzen da; izan ere, testu-sistema prediktiboak cool hitza idazterakoan book hitza hartzen du, cool baino ohikoagoa delako. Fenomeno horri kakografia esaten zaio. nahita egindako errore barregarriak dira horiek.

Desanbiguazioa eta ortografia akatsak[aldatu | aldatu iturburu kodea]

Tekla-pultsazio-sekuentzia bakarrerako hiztegiak hitz bat baino gehiago ematen dituen testunimoak ez dira arazo bakarra, ezta inportanteena ere, eta horrek mugatu egiten du iragarpen prediktiboen eraginkortasuna. Are garrantzitsuagoa da erantzun bakarra eta okerra ematen duten hitzen kasua. Sistema horrek, adibidez, Blairf-ekin erantzun dezake 252473 sartzean, bilatutako hitza Blaise edo Claire zenean, baina hitz horiek ez badaude testu prediktiboaren sisteman. Akats tipografiko edo ortografikoak gertatzen direnean, oso gutxitan gertatzen da behar bezala onartzea, nahiz eta akatsak zuzentzeko mekanismoek eragin hori arindu dezaketen.

kontzeptuak[aldatu | aldatu iturburu kodea]

  • Multitap
  • Laguntza teknologikoa
  • Autocomplete
  • Testu sarrera interfazea
  • Idazketa metodoaren editorea
  • Testu mezularitza
  • SMS hizkuntza
  • Speech to Text Reporter

Produktuak[aldatu | aldatu iturburu kodea]

  • T9 (testu prediktiboa)
  • iTAP
  • LetterWise
  • Q9 sarrera metodoa
  • Adaptxt
  • Lightkey

gailuak[aldatu | aldatu iturburu kodea]

  • iPhone
  • LG VX9400
  • Nokia 5510
  • Avigo 10

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. «KSPC (keystrokes per character) as a characteristic of text entry techniques» www.yorku.ca (Noiz kontsultatua: 2019-05-02).
  2. O’Riorda, Barry; Curran, Kevin; Woods, Derek. (2005-02-01). «Investigating Text Input Methods for Mobile Phones» Journal of Computer Science 1 (2): 189–199.  doi:10.3844/jcssp.2005.189.199. (Noiz kontsultatua: 2019-05-02).
  3. Fisher, Jamie. (2018-03-08). «The Left-Handed Kid» London Review of Books: 21–24. ISSN 0260-9592. (Noiz kontsultatua: 2019-05-02).
  4. a b «Change of Subject: Slang early-warning alert: `Book' is the new `cat's pajamas'» blogs.chicagotribune.com (Noiz kontsultatua: 2019-05-02).

Kanpo estekak[aldatu | aldatu iturburu kodea]