2024. november 24, vasárnap - Emma

Hírek

2021. Január 26. 12:02, kedd | Tech
Forrás: SG.hu

Húsz éves a Wikipedia, fejlesztik az Absztrakt verzióját

Húsz éves a Wikipedia, fejlesztik az Absztrakt verzióját

A világ legnépszerűbb online lexikona egyetlen nyelvet használva sokkal frissebb és bővebb lehetne.

20 éves a Wikipédia, amelynek a rendszerében jelenleg több mint 50 millió cikk található. Amennyiben az egyes nyelvi változatokat összesítenék és egyetlen nyelvűre fordítanák le, akkor az enciklopédia még nagyobb lehetne. Zdenko "Denny" Vrandecic informatikus és filozófus ezen dolgozik, gyakorlatilag az univerzális nyelvnek számító Absztrakt Wikipédiát fejleszti, amely a lexikon 300 kiadása között tenné lehetővé az automatikus fordítást. A 42 éves szakember a Karlsruhei Technológiai Intézetben végzett, majd megalapította a horvát Wikipédiát és a Wikidata projektet, tavaly óta pedig Berkeley városából dolgozik a Wikimédia Alapítványnak.

"Összehasonlítottam a különböző Wikipédiáikat és arra a kérdésre kerestem a választ, hogy ki San Francisco polgármestere. A találatok teljesen eltérők voltak, és csak kevés kiadásban szerepelt az aktuális városvezető. A legtöbb verzió ugyanakkor legalább egy polgármestert megnevezett a múltból. Számos információ elavult volt, nem politikai okokból, hanem egyszerűen azért, mert a frissítés plusz munkát jelentett volna. Ebben segíthetne a fordítási projektünk."

"Ideális esetben az ellentmondásokat nem automatikusan módosítanánk, hanem láthatóvá tennénk, hogy azokat a közösség könnyebben szerkeszthesse. Az első fordítási eredmények 2022-ben vagy 2023-ban várhatók. Úgy akarjuk megfogalmazni az egyes bejegyzéseket, hogy egy konkrét természetes nyelvtől függetlenek legyenek. Az absztrakt tartalom mindig ugyanaz lesz, függetlenül a célnyelvtől."

"Biztos komoly vita lesz erről a témáról, de ez így jó. A közösséggel együtt kell megbeszélnünk, hogy miként tudjuk a legjobban használni az új technológiákat. Egy szabályokon és funkciókon alapuló rendszer megalkotásán dolgozunk, amelyben a készítőknél van a tartalmakkal és az azok megjelenésével kapcsolatos teljes ellenőrzés, s nem kötődnek a nyelvi előítéletekhez. Emellett szükség lenne egy egyszerűbb, világosabb Wikipédiára és lehet, hogy a projektünk ehhez is hozzájárulhat" - jelentette ki Zdenko Vrandecic.
Az informatikus és filozófus hozzátette, hogy a legtöbb gépi tanulási program a hatalmas szövegmennyiségekre épít, amely ugyan olcsó, de nagy hibaszázalékú megoldás. A neurális hálózatok néha teljesen értelmetlen szövegeket készítenek, mert rosszul értelmezik a mondatokat. Az Absztrakt Wikipédia rendszere ezzel szemben a pontosságra épít, a működési elve pedig a Rule Based Natural Language Generation, amit először a Xerox alkalmazott az eszközei használati útmutatóihoz.

A szakember végül elmondta, hogy a projekt eredetileg a Google égisze alatt zajlott, amely nagyon nagy segítséget jelentett, de később kiderült, hogy a fejlesztés a Wikimédia Alapítványnál jobb kezekben van.

Címkék: Tech, Wikipedia

Ezek érdekelhetnek még

2024. November 19. 14:20, kedd | Kzélet

Tomáš: Történelmi minimumot ért el a munkanélküliség októberben

A munkaügyi miniszter rámutatott, hogy az egyik fontos projekt, amelyet Juttatás helyett Munka néven neveztek el, ezen a héten kerül véleményezésre, hatálybalépése már 2025 közepén várható.

2024. November 19. 13:51, kedd | Világ

Putyin új nukleáris doktrínát hagyott jóvá

A doktrína szerint Moszkva fenntartja a jogot, hogy egy nagyszabású támadás esetén fontolóra vegye a nukleáris fegyverek alkalmazását.

2024. November 18. 14:41, hétfő | Sport

ATP: Sinner, Zverev és Fritz pályára lépnek Münchenben

A regnáló világelső először vesz részt az 1899-ben először megrendezett eseményen, amelyre jövőre április 14. és 20. között kerül sor.

2024. November 18. 14:28, hétfő | Kzélet

A biztosítók 89,6 millió eurós veszteséget könyveltek el szeptember végén

Szeptember végén a VšZP saját tőkéje mínusz 2,7 millió euró, a Dôvera biztosítóé 179,7 millió euró, az Unioné pedig 25 millió euró volt.