Nowe oprogramowanie Google precyzyjnie rozpozna obrazy na zdjęciach

Nowa technologia opracowana w laboratoriach Google pozwoli maszynom na dokładne rozpoznawanie i opisywanie treści umieszczonych na fotografiach.

ps
ps
Udostępnij artykuł:
Nowe oprogramowanie Google precyzyjnie rozpozna obrazy na zdjęciach

O opracowaniu nowatorskiego rozwiązania poinformowali na blogu laboratorium Google Research jego naukowcy - Oriol Vinyals, Alexander Toshev, Samy Bengio i Dumitru Erhan. Według nich udało się opracować system, który pozwoli maszynom rozpoznawać obrazy w podobny sposób, jak dzieje się to u człowieka.

- Ludzie bez trudu potrafią zamknąć w kilku słowach opisu treść, którą widzą na fotografii - tłumaczą badacze. - Dla komputerów to o wiele trudniejsze zadanie. Udało nam się jednak posunąć o krok naprzód i opracować oprogramowanie, które pozwala maszynom w automatyczny sposób precyzyjnie rozpoznać obiekty na zdjęciu, a dodatkowo prawidłowo je opisać. Taka technologia stwarza wiele niedostępnych dotąd możliwości i rozwiązań - podkreślają.

grafika

Oprogramowanie stworzone przez Google może między innymi pomóc osobom niepełnosprawnym (na przykład niewidomym) w zrozumieniu tego, co znajduje się na konkretnym zdjęciu, a także w otaczającej ich rzeczywistości bez pomocy innych, a jedynie przy użyciu komputera. Mechanizm bezbłędnie identyfikujący treść konkretnego obrazu i rozumiejący jego znaczenie okaże się też przydatny w systemach monitoringu lub identyfikacji.

Na blogu Google Research autorzy nowatorskiego oprogramowania wyjaśniają sposób jego funkcjonowania. Jest ono złożone z dwóch niezależnych sieci zbudowanych na wzór połączeń nerwowych u żywych istot. Jedna z sieci jest przeznaczona do rozpoznawania tego, co widzi, zadaniem drugiej jest precyzyjne opisanie otrzymanych danych. W rezultacie powstaje zespół, który pozwala na opisanie konkretnego obrazu z niewielkim marginesem błędu.

grafika

Vinyals, Toshev, Bengio i Erhan przyznają, że koncepcja opracowania nowego mechanizmu postrzegania obrazów powstała przy okazji prac prowadzonych nad doskonaleniem automatycznego tłumaczenia, które Google rozwija od wielu lat. Stosowana w tej technologii sieć rekurencyjna została zastąpiona siecią splotową, co w rezultacie pozwala na odczytywanie obrazów i ich opis w sposób o wiele bardziej dokładny i bezbłędny, niż miało to miejsce wcześniej, przed stworzeniem wspomnianego oprogramowania.

PRACA.WIRTUALNEMEDIA.PL

NAJNOWSZE WIADOMOŚCI

Republika odkrywa gwiazdy "Wystrzałowego sylwestra". Kto poprowadzi koncert?

Republika odkrywa gwiazdy "Wystrzałowego sylwestra". Kto poprowadzi koncert?

Transmisja Oscarów przenosi się na YouTube. Epokowa zmiana

Transmisja Oscarów przenosi się na YouTube. Epokowa zmiana

"Efekt Australii"? Meta wprowadzi nową metodę weryfikacji wieku

"Efekt Australii"? Meta wprowadzi nową metodę weryfikacji wieku

Iga Świątek najlepsza w plebiscycie Interii i Polsatu Sport

Iga Świątek najlepsza w plebiscycie Interii i Polsatu Sport

Rift Legends po pierwszym roku działalności. Wyjątkowe możliwości reklamowe w polskim esporcie
Materiał reklamowy

Rift Legends po pierwszym roku działalności. Wyjątkowe możliwości reklamowe w polskim esporcie

Gloria Adamek w zespole agencji OBTK

Gloria Adamek w zespole agencji OBTK