Minął miesiąc, a śląski Translator Google niczego się nie nauczył. Jak rozwija się najpopularniejszy tłumacz maszynowy na świecie?

Tłumacz Google 27 czerwca włączył język śląski do grona języków, z których/na które da się automatycznie przetłumaczyć tekst. Poza śląskim do Translatora dodanych zostało 109 innych, nowych języków, jak np. sycylijski, wenecki i tok pisin. Miesiąc temu informowaliśmy was o aktualizacji. Nie dało się ukryć, że tłumaczenia nie były najwyższych lotów. A jak jest teraz – miesiąc od premiery ślōnskij godki w Google Translate?

Tłumacz Google to bezpłatna usługa Google, umożliwiająca szybkie tłumaczenie słów, zwrotów i stron internetowych. Do niedawna baza języków translatora wynosiła ok. 130 lektów. Od 27 czerwca 2024 roku można tłumaczyć z i na 110 nowych (głównie małych i regionalnych) języków – w ich gronie znalazł się śląski. Co ciekawe w Tłumaczu Google nie znajdziemy jeszcze kaszubskiego, który w Polsce ma prawny status języka regionalnego.

Jak to wygląda po miesiącu?

Od razu, gdy śląski miał swoją premierę w Tłumaczu Google, sprawdziliśmy jego dokładność. Efekty nie były zadowalające. Większość tłumaczeń wyglądała zwyczajnie śmiesznie. Poza tworzeniem kalek językowych, co da się zrozumieć, tłumacz nie radził sobie z podstawową gramatyką (np. tłumaczenie jem na jedzōm).

My w Ślązagu chcieliśmy sprawdzić czy przez miesiąc od aktualizacji coś się zmieniło. Miesiąc temu eksperci byli zgodni, że AI Google szybko nauczy się śląskiego i poprawi błędy. „Trzymam kciuki za jego rozwój i wierzę, że zwiększona baza pamięciowa oraz rozwój AI będą systematycznie pozytywnie wpływały na poziom tłumaczenia – mówił wtedy Bartłůmjej Wanot, tłumacz i aktywista językowy. Niestety, jak dotąd, tłumaczenia wyglądają tak samo. Może to być spowodowane użytą technologią.

Wszystkie nowo dodane języki są tłumaczone technologii o nazwie Zero-Shot Machine Translation. Tego typu narzędzia AI uczą się na ograniczonej (prawie zerowej) liczbie przykładów, ale znają kontekst. Przykładowo: AI widziało tylko zdjęcia konia, ale wie, że zebra wygląda jak koń w paski – kiedy zobaczy zdjęcie zebry, rozpozna zwierzę. Tłumacz Google prawdopodobnie nigdy nie widział słowa jym, ale wie, że mam to po śląsku mōm. Dlatego zakłada, że w przypadku czasownika jeść będzie tak samo. Można powiedzieć, że Google Translate po prostu zgaduje. Twórcy technologii sami podkreślają, że technologia wciąż w fazie rozwoju i jak dotąd jest mało efektywna. Jej zaletą z kolei jest to, że wymaga mało mocy obliczeniowej. Przydaje się to do obsługi 110 różnych języków.

Czy tłumacza da się jakoś usprawnić?

Do niedawna Google promowało rozwój swojej technologii przez użytkowników. Firma stworzyła narzędzie Google Crowdsource, gdzie użytkownicy mogli tłumaczyć podane zdania i oceniać istniejące tłumaczenia. Niestety, w 2024 roku zrezygnowano z tej opcji, co zbiegło się w czasie z zastosowaniem technologii Shot Machine Translation. Jeśli chcieliście pomóc Googlowi z nauką śląskiego, to nie ma obecnie takiej możliwości. Musimy zadowolić się tym, co mamy.

Dla przykładu przetłumaczyłem też parę zdań z języków innych niż polski. Efekty możecie zobaczyć w galerii. Jak widać tłumacz błędy robi w każdym przypadku.

Bytom po zmroku

Może Cię zainteresować:

Kto ma ochotę na nocny spacer z dreszczykiem? Oczywiście po Bytomiu

Autor: Aleksandra Szlęzak

29/07/2024

Monika rosa

Może Cię zainteresować:

Monika Rosa przewodniczącą nowej komisji w Sejmie. Czym będzie zajmować się Komisja ds. Dzieci i Młodzieży?

Autor: Szymon Karpe

29/07/2024

Nowa część fasady przy ulicy Kwietniewskiego

Może Cię zainteresować:

Fasada z Kwietniewskiego się rozrosła. Niestety wandale wciąż dają o sobie znać

Autor: Daniel Lekszycki

28/07/2024

Subskrybuj ślązag.pl

google news icon