Nowe oprogramowanie Google precyzyjnie rozpozna obrazy na zdjęciach

Nowa technologia opracowana w laboratoriach Google pozwoli maszynom na dokładne rozpoznawanie i opisywanie treści umieszczonych na fotografiach.

ps
ps
Udostępnij artykuł:
Nowe oprogramowanie Google precyzyjnie rozpozna obrazy na zdjęciach

O opracowaniu nowatorskiego rozwiązania poinformowali na blogu laboratorium Google Research jego naukowcy - Oriol Vinyals, Alexander Toshev, Samy Bengio i Dumitru Erhan. Według nich udało się opracować system, który pozwoli maszynom rozpoznawać obrazy w podobny sposób, jak dzieje się to u człowieka.

- Ludzie bez trudu potrafią zamknąć w kilku słowach opisu treść, którą widzą na fotografii - tłumaczą badacze. - Dla komputerów to o wiele trudniejsze zadanie. Udało nam się jednak posunąć o krok naprzód i opracować oprogramowanie, które pozwala maszynom w automatyczny sposób precyzyjnie rozpoznać obiekty na zdjęciu, a dodatkowo prawidłowo je opisać. Taka technologia stwarza wiele niedostępnych dotąd możliwości i rozwiązań - podkreślają.

grafika

Oprogramowanie stworzone przez Google może między innymi pomóc osobom niepełnosprawnym (na przykład niewidomym) w zrozumieniu tego, co znajduje się na konkretnym zdjęciu, a także w otaczającej ich rzeczywistości bez pomocy innych, a jedynie przy użyciu komputera. Mechanizm bezbłędnie identyfikujący treść konkretnego obrazu i rozumiejący jego znaczenie okaże się też przydatny w systemach monitoringu lub identyfikacji.

Na blogu Google Research autorzy nowatorskiego oprogramowania wyjaśniają sposób jego funkcjonowania. Jest ono złożone z dwóch niezależnych sieci zbudowanych na wzór połączeń nerwowych u żywych istot. Jedna z sieci jest przeznaczona do rozpoznawania tego, co widzi, zadaniem drugiej jest precyzyjne opisanie otrzymanych danych. W rezultacie powstaje zespół, który pozwala na opisanie konkretnego obrazu z niewielkim marginesem błędu.

grafika

Vinyals, Toshev, Bengio i Erhan przyznają, że koncepcja opracowania nowego mechanizmu postrzegania obrazów powstała przy okazji prac prowadzonych nad doskonaleniem automatycznego tłumaczenia, które Google rozwija od wielu lat. Stosowana w tej technologii sieć rekurencyjna została zastąpiona siecią splotową, co w rezultacie pozwala na odczytywanie obrazów i ich opis w sposób o wiele bardziej dokładny i bezbłędny, niż miało to miejsce wcześniej, przed stworzeniem wspomnianego oprogramowania.

PRACA.WIRTUALNEMEDIA.PL

NAJNOWSZE WIADOMOŚCI

Dwa miesiące i nic. Książka Karoliny Opolskiej nadal bez erraty. Gra na zwłokę?

Dwa miesiące i nic. Książka Karoliny Opolskiej nadal bez erraty. Gra na zwłokę?

Australijskie nastolatki bez social mediów. Meta kasuje miliony kont

Australijskie nastolatki bez social mediów. Meta kasuje miliony kont

Znamy uczestników 3. edycji IAA Polska Marketing Masterminds

Znamy uczestników 3. edycji IAA Polska Marketing Masterminds

Prime Video podał datę premiery serialu dokumentalnego "Doda"

Prime Video podał datę premiery serialu dokumentalnego "Doda"

Tu zapadają decyzje o przyszłości mediów. Forum Technologii Cyfrowych i Mediów już 15–16 stycznia
Materiał reklamowy

Tu zapadają decyzje o przyszłości mediów. Forum Technologii Cyfrowych i Mediów już 15–16 stycznia

Monika Garbacz account director w Altavia Kamikaze + K2

Monika Garbacz account director w Altavia Kamikaze + K2