Bilaketa aurreratua

Ogi apurrak

Corpus Arakatzaile Sintaktikoa (CAS)

 

Tresna honi buruz

Bilaketa nola egin

Zer informazio mota ematen du aplikazio honek? Kontsulta egin nahi duenak perpaus bat idatzi behar du, aukeran, nahi duena. Jo dezagun hau idazten duela (ikus beherago izen bereziei buruz esaten duguna):

entzule gehienek triste amaituko dute ikastaroa

Horren gainean aplikazioak bi gauza egiten ditu:

1) Perpausa zatitu edo segmentatzen du, osagai nagusiak bereiziz. Kasu honetan identifikatzen dituen zatiak (segmentuak) honako hauek dira:

[ikasleak]  [etxera]  [etorri dira]

Eta zati horiei izen bana jarriko die: <IS nor>, <IS nora> <AS>

2) Hori egin ondoren, aplikazioak EPGn dagoen informazioa arakatuko du eta han identifikatuko ditu corpusean ageri diren segmentu horien gisako perpaus guztiak

 

Oharrak

Perpausak idazteko orduan izen arruntak nahiz bereziak aukera daitezke: neska mendira joan da; Miren mendira joan da; neska Gasteiza joan da.... Edozein izen arrunt idatz daiteke. Izen bereziei dagokienez, ordea, zerrenda batetik aukeratu behar dira ezinbestean (Miren, Jon, Patxi, Itziar, Bilbo, Gasteiz, Donostia, Gipuzkoa, Araba, Bizkaia, Nafarroa, Lapurdi, Baiona, Zuberoa, Maule).

Beraz, aplikazioak ez du bilatzen kontsulta egiten duenak idazten duen perpausa (hori EPGn bila daiteke), baizik perpaus horren gisara eratuak dauden corpuseko perpaus guztiak. Arruntena litzateke idazten den perpausa ez agertzea corpusean.

Aplikazioak egiten duen zatikatzea azalekoa da, segmentuen artean dauden mailak (osagai batzuk aditzari lotuago daude beste batzuk baino, esaterako) bereizi gabe. Denak parean jartzen ditu. Eta <AS> ere, adibidez, zentzu zabalean ulertzen da: amaituko dute, amaituko omen dute, amaitzen ahal dute... denei <AS> izena ematen die, osagai bakarra balitz bezala. Berdin gertatzen da ikasle gehienek eta ikasleek segmentuekin. Biak dira <IS> nork. Horregatik diogu azaleko analisi sintaktikoa dela (chuncker esaten zaio ingelesez). Hala ere, eta aplikazioa findu behar baldin bada ere —huts bat edo beste egiten baitu—, informazio asko ematen du aplikazioak, gehien erabiltzen diren zatien hurrenkerei buruz, esaterako.

Datuak bistaratzeko orduan aplikazioak denbora eskatzen du. Beraz, denbora eman behar zaio datu guztiak prozesatzen dituen bitartean. Lastertasuna, zernahi gisaz, lanabes egokiak garatu ahala arinduko da.

 

Bilaketa murriztuagoa nola egin

Bilaketa orokorraz gain, bilaketa murriztuak ere egin daitezke. Betiere hasieran idatzi den esaldiaren osagaietatik abiaturik.  Horrela, goian entzule gehienek... idatzi baldin bada bilatzaileak horren parean jarriko ditu maisu gehienek, ikaske guztiek, alkateek... eta horien gisako guztiak. Ikasleak etxera etorriko dira idatziz gero aplikazioak zaku berean sartuko ditu izpiritua Heletara airatu zait; begiak aulki batera itzuli ziren edo doktorea burura etorri zitzaion; edertasuna sentimen orotara hegaldatzen da eta idazle batzuk plaza handi batera iritsi ginen. Perpaus horiek guztiek egitura bera lukete arakatzaile honentzat. Horien ezezkoak ere, jakina, agertuko lirateke.

Gerta daiteke, ordea, bilaketa egitean interes zehatzagoa izatea: beharbada, ez ditugu ikusi nahi aukeratu perpausaren egitura duten perpaus guztiak ikusi nahi, baizik batzuk bakarrik. Esaterako etorri aditza daramatenak bakarrik (orduan airatu, itzuli edo iritsi baztertuko ditu aplikazioak). Edo ez zaizkigula subjektu guztiak interesatzen, baizik hirugarren pertsonakoak bakarrik (kasu horretan zuek guregana etorriko zarete perpausaren gisakoak baztertuko lituzke).

Murrizketa egiteko “Blokeen ezaugarriak ikusi/ezeztatu” izeneko erlaitza klikatu behar da. Hor ageriko dira bilatzailean idatzi den perpausak dituen zatiak bezainbat zutabe. Zutabe bakoitzean “H” (hitza), “L” (lema) eta “M” (morfologia markak) aukera daitezke. Gure adibidean aukera ematen du ikasleak hitza aukeratzeko (orduan <IS-nor> beti ikasleak izango da, eta gainerako izenak ez dira bistaratuko) edo ikasle lema aukeratzeko (eta orduan horren aldaerak dituzten perpausak agertuko lirateke: ikasle hori, ikasle haiek, ikaslea, ikasleok..., baina ez, adibidez, andreak, gazteak...); edo M aukera daiteke KASua, KATegoria eta NUMeroa. Adibidez, nor kasua aukera daiteke, ize KAT ezaugarria (beraz, izena bakarrik: aplikazioak zuriak Afrikan bizi dira gisako esaldiak baztertuko lituzke) edo pl ere aukera daiteke (eta horrek Jon goizean gaixotu da gisako perpausa baztertuko luke).

Gauza bera egin behar da gainerako segmentuei dagozkien zutabeekin ere.

Nodoa: liferay1.lgp.ehu.eus