Изкуствен интелект на Facebook извлича текст от снимки и видео

Компанията добавя нови 24 езика към автоматизираните си преводачески услуги, между които непалски, урду, пенджабски, камбоджански
Когато хората общуват онлайн, те са склонни да го правят не само с думи, но и с образи. За платформа като Facebook, която има над 2 милиарда активни месечни потребители, това означава, че дневното количество публикувани изображения е огромно, включително такива, които включват и текст. За да включи тези изображения в съответните резултати от търсене и да се подсигури, че върху тях няма надписи, които нарушават правилата за съдържание на платформата, Facebook e създала широкомащабна система за машинно обучение, наречена Rosetta.

За целта Facebook се нуждае от оптична система за разпознаване на символи, която може регулярно да обработва огромни обеми съдържание. Така компанията решава да разработи своя собствена технология. Според социалната мрежа към днешна дата Rosetta извлича текст от повече от един милиард изображения и видеоклипове с голямо разнообразие от езици ежедневно, като при това процесът се реализира в реално време.

Публикация в блога на компанията обяснява точно как работи Rosetta. Първоначално системата започва открива правоъгълни пространства в изображенията, които потенциално могат да съдържат текст. След това тя използва конволюционна невронна мрежа, за да разпознае и транскрибира това, което е написано във въпросното пространство, независимо дали то е на английски, друг език, използващ латински букви, арабски или хинди. За да тренира системата, Facebook използва смесица от публични изображения, анотирани от хора и машини.

Rosetta вече се използва активно както във Facebook, така и в Instagram, за да могат администраторите да проследяват по-големи количества информация и да гарантират спазването на политиките за съдържание на платформите. Компанията планира да продължи да увеличава броя на езиците, които системата може да разбере, и да засили възможностите ѝ за извличане на текст от видеокадри.

И като заговорихме за езици, Facebook също така добавя и 24 нови езика към своите автоматизирани услуги за превод, включително сръбски, беларуски, непалски, урду, пенджабски, камбоджански, пущу, монголски, зулу и т.н. Засега от компанията признават, че преводите на тези езици са на ранен етап на развитие и все още се получават много грешки, но с времето те ще намаляват все повече.
още по темата

AI на Google открива ракови метастази по-добре от човек

LYNA е още по-ефективен инструмент, когато служи като партньор на лекарите
15.10.2018 / 11:16

Двуфакторната автентикация в Instagram вече е достъпна

Повече няма да ви се налага да използвате текстови съобщения
10.10.2018 / 10:21

Facebook търгува и с телефонните номера на потребителите

Платформата предоставя данните за двуфакторно удостоверяване на рекламодатели, практикува и "сенчесто" придобиване на контактна информация
28.09.2018 / 11:33

Instagram пуска опция за уведомления в Lite и уеб версията

Можете да я активирате като влезете в платформата през Chrome
26.09.2018 / 11:13

Facebook представя устройство за видеоразговори до края на годината

Portal ще разчита на изкуствен интелект и дигиталния асистент Alexa
21.09.2018 / 11:49
Twitter icon Facebook icon
Този сайт използва бисквитки (cookies). Ако желаете можете да научите повече тук.