Nowe oprogramowanie Google precyzyjnie rozpozna obrazy na zdjęciach

Nowa technologia opracowana w laboratoriach Google pozwoli maszynom na dokładne rozpoznawanie i opisywanie treści umieszczonych na fotografiach.

ps
ps
Udostępnij artykuł:
Nowe oprogramowanie Google precyzyjnie rozpozna obrazy na zdjęciach

O opracowaniu nowatorskiego rozwiązania poinformowali na blogu laboratorium Google Research jego naukowcy - Oriol Vinyals, Alexander Toshev, Samy Bengio i Dumitru Erhan. Według nich udało się opracować system, który pozwoli maszynom rozpoznawać obrazy w podobny sposób, jak dzieje się to u człowieka.

- Ludzie bez trudu potrafią zamknąć w kilku słowach opisu treść, którą widzą na fotografii - tłumaczą badacze. - Dla komputerów to o wiele trudniejsze zadanie. Udało nam się jednak posunąć o krok naprzód i opracować oprogramowanie, które pozwala maszynom w automatyczny sposób precyzyjnie rozpoznać obiekty na zdjęciu, a dodatkowo prawidłowo je opisać. Taka technologia stwarza wiele niedostępnych dotąd możliwości i rozwiązań - podkreślają.

grafika

Oprogramowanie stworzone przez Google może między innymi pomóc osobom niepełnosprawnym (na przykład niewidomym) w zrozumieniu tego, co znajduje się na konkretnym zdjęciu, a także w otaczającej ich rzeczywistości bez pomocy innych, a jedynie przy użyciu komputera. Mechanizm bezbłędnie identyfikujący treść konkretnego obrazu i rozumiejący jego znaczenie okaże się też przydatny w systemach monitoringu lub identyfikacji.

Na blogu Google Research autorzy nowatorskiego oprogramowania wyjaśniają sposób jego funkcjonowania. Jest ono złożone z dwóch niezależnych sieci zbudowanych na wzór połączeń nerwowych u żywych istot. Jedna z sieci jest przeznaczona do rozpoznawania tego, co widzi, zadaniem drugiej jest precyzyjne opisanie otrzymanych danych. W rezultacie powstaje zespół, który pozwala na opisanie konkretnego obrazu z niewielkim marginesem błędu.

grafika

Vinyals, Toshev, Bengio i Erhan przyznają, że koncepcja opracowania nowego mechanizmu postrzegania obrazów powstała przy okazji prac prowadzonych nad doskonaleniem automatycznego tłumaczenia, które Google rozwija od wielu lat. Stosowana w tej technologii sieć rekurencyjna została zastąpiona siecią splotową, co w rezultacie pozwala na odczytywanie obrazów i ich opis w sposób o wiele bardziej dokładny i bezbłędny, niż miało to miejsce wcześniej, przed stworzeniem wspomnianego oprogramowania.

Author widget background

PRACA.WIRTUALNEMEDIA.PL

NAJNOWSZE WIADOMOŚCI

To już pewne. Netflix w przyszłym roku wprowadzi w Polsce reklamy

To już pewne. Netflix w przyszłym roku wprowadzi w Polsce reklamy

Rada programowa domaga się wycofania reklam z kanału TVP

Rada programowa domaga się wycofania reklam z kanału TVP

Twórcy konkursu Podcast Roku zapraszają na Inspiration Day

Twórcy konkursu Podcast Roku zapraszają na Inspiration Day

ASAP&ASAP realizuje kampanię launchową nowego modelu Isuzu

ASAP&ASAP realizuje kampanię launchową nowego modelu Isuzu

Nowa naczelna "Aktivista". W przeszłości w "Vogue Polska"

Nowa naczelna "Aktivista". W przeszłości w "Vogue Polska"

Wawrzyniec Kostrzewski dołącza do Under Ski Tower

Wawrzyniec Kostrzewski dołącza do Under Ski Tower