"Biblijski" algoritam
Softver koji je razvio jedan izraelski tim otkriva nove pojedinosti o Bibliji. Novi kompjuterski program analizira stil i izbor reči pojedinih delova teksta, proveravajući da li ga je napisao jedan ili više autora.
Primenjen na Bibliju, njegov algoritam potvrdio je ono što su erudite već ustanovile - da u Svetom pismu postoji više različitih "glasova". Izraelski softver - deo podoblasti studija o veštačkoj inteligenciji, poznatoj pod nazivom autorska atribucija, ima širok dijapazon potencijalnih primena - od kriminalističkih istraga do razvoja novih kompjuterskih programa za pisce.
Biblija svojim obimom i kompleksnošću predstavlja pravi izazov za kreatore novog algoritma. Za milione Jevreja i hrišćana, Bog je autor osnovnog teksta hebrejske Biblije - Tore, poznate i kao Petoknjižje ili Pet knjiga Mojsijevih.
Viševekovno proučavanje Biblije, međutim, otkrilo je da je Sveto pismo napisalo nekoliko autora čiji se rad razlikuje na osnovu posebnih lingvističkih stilova, ideoloških matrica i različitih naziva za Boga.
Danas, istraživači Sveto pismo dele na dva dela - jedan za koji veruju da ga je napisao jedan ili grupa autora i koji nazivaju "svešteničko" predanje, dok ostatak pripada tzv. nesvešteničkom predanju. Istraživači su detaljno proučili i analizirali tekstove kako bi utvrdili koji delovi pripadaju kojoj grupi autora.
Ko je sve pisao Bibliju?
Primenom novog softvera na Petoknjižje ustanovljena je gotovo identična podela na "svešteničko" i "nesvešteničko" predanje. Do podudaranja softverske analize sa tradicionalnom akademskom podelom došlo je u 90 odsto slučajeva.
"Ono za šta su eruditama bile potrebne godine strpljivog rada, kompjuterski softver je obavio za svega nekoliko minuta", kazao je profesor kompjuterskih nauka i vođa istraživanja Moše Kopel sa Bar Ilan Univerziteta u Tel Avivu.
"Automatizovanom metodom uspeli smo da obavimo kratak pregled nekoliko vekova mukotrpnog manuelnog rada", naveo je izraelski tim u studiji koju je prezentovao prošle sedmice na godišnjem skupu Udruženja kompjuterske lingvistike u Portlandu, u saveznoj američkoj državi Oregon.
Deo u kome kompjuterski program odudara od analize erudita mogao bi istraživačima da pruži nove, interesantne smernice.
Za prvo poglavlje knjige Postojanja, na primer, obično se veruje da pripada "svešteničkom" predanju, ali softver upućuje na suprotan zaključak.
Na sličan način se za knjigu proroka Isaija veruje da su je napisala dva autora i da je drugi nastavio da je piše od 39. poglavlja. Rezultati softvera potvrđuju da knjiga ima dva autora, ali sugeriše da je drugi autor počeo sa pisanjem šest poglavlja ranije, tj. od 33. poglavlja.
U protekloj deceniji, istraživači su sve više koristili kompjuterske programe za pretraživanje i upoređivanje biblijskih tekstova. Novina izraelskog softvera je u tome što on naučne kriterijume primenjuje pomoću tehnološkog oruđa koje je po mnogo čemu moćnije od ljudskog uma, navodi Majkl Sigal sa Hebrejskog univerziteta koji nije učestvovao u projektu.
Pre nego što su svoj softver primenili na Petoknjižje i druge biblijske knjige, istraživači su prvo morali da obave test kojim će dokazati da je algoritam u stanju da razlikuje jednog autora od drugog.
Za taj test nasumice su izmešali delove knjiga proroka Ezekiela i Jeremije u jedan tekst koji su potom analizirali novim softverom. Program je tekst "gotovo savršeno" razvrstao u adekvatne celine.
Identifikacija pisaca
Drugi istraživači su koristili slične algoritme kako bi identifikovali nepoznate pisce. Tokom 90-ih godina, profesor engleske književnosti Donald Foster sa Vasar koledža uspeo je da na taj način otkrije ime anonimnog autora jedne knjige koristeći manje detalje poput interpunkcije.
Godine 2003, Kopel je sa timom istraživača razvio softver koji je mogao gotovo 100 procentno da utvrdi da li je autor muškarac ili žena. Oni su tom prilkom otkrili da žene daleko više koriste lične, a muškarci pokazne zamenice.
Uspeh ovog projekta podstakao je debatu o tome kako polovi oblikuju naš način razmišljanja i komunikaciju. Ovakva istraživanja imaju potencijalnu primenu i u vođenju kriminalističkih istraga, tako što policiji pomažu da otkrije prevarante i plagijatore.
Budući da se analizom mogu ustanoviti pol i godine, novi algoritmi bi mogli da pomognu oglašivačima da bolje usmere svoje reklamne kampanje prema ciljnim grupama.
Novi softver bi mogao da se iskoristi i za proveru autentičnosti tekstova, na primer, Šekspirovih komada, kako bi se definitivno rešilo pitanje njihovog autorstva ili eventualnog koautorstva.