
Tam je ogromno raziskav, katerih obseg z vsakim dnem hitro narašča. Ampak obstaja problem.
Ne samo, da je veliko obstoječe literature skrito za plačilnim zidom, ampak jo je lahko tudi težko razčleniti in razumeti na celovit, logičen način. Kar resnično potrebujemo, je super pametna različica Googla samo za akademske članke.
Vnesite Splošno kazalo , novo zbirko podatkov s približno 107,2 milijoni člankov v revijah, kar skupaj obsega 38 terabajtov podatkov v nestisnjeni obliki. Obsega več kot 355 milijard vrstic besedila, od katerih vsaka vsebuje ključno besedo ali frazo, povzeto iz objavljenega prispevka.
'To je orodje za iskanje, slovar znanja, zemljevid znanja,' pravi ustvarjalec Indeksa , arhivist Carl Malamud. 'Orodje, za katerega menimo, da je bistven pripomoček za prakso znanosti v naši moderni dobi.'
Čeprav smo omenili Google, to ni ravno iskalnik – znanstveniki, ki uporabljajo splošni indeks, bodo morali kodirati lastne iskalnike, da bodo z njim delali. Namesto tega je skrbno katalogiziran in strukturiran katalog, ki ga je mogoče uporabiti za raziskovanje desetletij vrednih znanstvenih raziskav.
Njegov glavni namen je pomagati pri besedilno rudarjenje : uporaba računalnikov za hitro skeniranje milijonov podatkovnih točk za iskanje in navzkrižno povezovanje sklicev na nekaj specifičnega. Človeška bitja nikakor ne morejo prebrati in izbrati ključnih podatkov iz milijonov člankov v revijah, toda računalniški program, povezan s splošnim indeksom, lahko.
Odzivi drugih znanstvenikov so bili pozitivni. Eden od strokovnjakov, računalniški biolog Gitanjali Yadav z Univerze v Cambridgeu v Združenem kraljestvu, pravi, da nova baza podatkov do neke mere rešuje problem omejenega dostopa do predhodno objavljenega gradiva.
'Zame ali za koga drugega ni možnosti, da bi eksperimentalno analiziral ali izmeril kemični prstni odtis vsake rastlinske vrste na Zemlji,' je dejal Yadav. Narava . 'Veliko informacij, ki jih iščemo, že obstaja v objavljeni literaturi.'
Ideja je, da se splošni indeks lahko uporablja za iskanje rastlin, kemikalij, genov, beljakovin, materialov, imen krajev in še veliko več – čeprav ekipa, ki stoji za njim, želi poudariti, da ga je treba še nekaj pospraviti in razširiti, in je zelo v teku (kot verjetno vedno bo).
Vse te informacije so na voljo za brezplačen prenos in uporabo portal General Index , brez uporabe avtorskih pravic in brez omejitev – Indeks so le izrezki prispevkov, ne prispevki sami. Kot smo že omenili, boste potrebovali nekaj spretnosti kodiranja, da boste iz tega resnično imeli kakršen koli smisel.
Za razliko od kontroverznega portala Sci-Hub, čeprav Index ne gosti vseh člankov pojavila so se vprašanja glede zakonitosti projekta. Za Malamuda projekt dobro sodi v zakonske meje.
'Zelo sem prepričan, da je to, kar počnem, zakonito,' je povedal Malamud Narava . 'Tega ne počnemo, da bi izzvali tožbo, ampak da bi napredovali v znanosti.'