Tyxo.bg counter

Google обучава изкуствен интелект да създава пространствени перспективи

DeepMind събира снимки от различни ъгли в триизмерна среда и пресъздава начина, по който би изглеждала тя, от непознат ракурс

Системата за машинно обучение на Google - DeepMind - може да събира снимки от различни ъгли в триизмерна среда и да пресъздава начина, по който би изглеждала тя, от ракурс, който изкуственият интелект никога не е виждал преди това, съобщава изданието Science.

Голямата картина: Изследователите искат да създадат изкуствен интелект, който да може да създава модели на света около нас на база получени данни, като впоследствие използват въпросните модели в нова среда. Тази способност би могла да изведе изкуствения интелект от сферата на изучаването на пространството до тази на разбирането му по сходен с човека начин. Това би имало ключово значение за разработването на машини, които могат да се движат автономно в реална среда, като автономните коли.

Контекстът: Компютърното зрение, стимулирано от наличието на огромни количества данни и увеличени изчислителни възможности, се разви изключително много през последните шест години. В общия случай алгоритмите до голяма степен се учат чрез наблюдение, като им се подава голям набор от данни, обозначени с информационни етикети, и се очаква да генерират прогнозни резултати от тяхното взаимодействие.

"Контролираното обучение е давало много добри резултати, но не е напълно удовлетворяващо по две причини. Първата е, че хората трябва да създадат ръчно набора от данни за обучение, което е скъпо и се допускат пропуски. И второ, това определено не е естественият начин, по който се учат бебетата или по-висшите бозайници", смята Али Еслами, изследовател в DeepMind

Вместо това, изследователите искат да обучат машините да асимилират необозначени данни, които да обработват без каквото и да било ръководство от човек, а след това да могат да прилагат наученото в нови, непознати сценарии и задачи.

Как работи: Системата използва двойка изображения на виртуална 3D сцена, взети от различни ъгли, за да се създаде пространствена представа, а генеративната мрежа за заявки (GQN) прогнозира как ще изглежда сцената от друга, непозната към момента гледна точка. След като GQN тренира с милиони изображения, тя може да използва едно от тях, за да определи идентичността, позицията и цвета на обектите, както и светлосенките и други аспекти на перспективата.

„Тази способност да се разбере структурата на сцената е "най-завладяващата" част от изследването“, пише Матиас Зуйкър от Университета в Мериленд.

Изследователите на DeepMind също така са тествали възможностите на изкуствения интелект в т.нар. лабиринт, като тестовете са показали, че мрежата може точно да предскаже дадена сцена и само с частична информация.

Да, но: Според Зуйкър обаче до момента става дума за опити с относително прости виртуални среди и "остава неясно колко доколко тази система ще работи в сложни среди от реалния свят."

Пред MIT Technology Review, друг експерт – Сам Гершман от Харвард – коментира от своя страна, че GQN все още решава само проблеми с ограничена сложност като предскзването на перспектива, но изразява съмнения относно възможностите ѝ да се адаптира, за да отговори на по-сложни въпроси, което пък може да доведе до нуждата от фундаментално различен подход.

Предизвикателствата: Изследователят от Deep Mind Али Еслами разказва, че тренировъчният процес отнема няколко месеца. "Използвахме в максимална степен наличния ни хардуер. Нуждаем се от засилване на изчислителните способности и техниките за изграждане на дълбоки невронни мрежи и тяхното обучение”, добавя той.

 

още по темата

Роботи с големината на клетка ще помагат за ранното диагностициране на болести

Екип на MIT смята, че е създал най-малките машини, виждани досега, което отваря нови полета за роботиката
24.07.2018 / 11:26
Twitter icon Facebook icon
Този сайт използва бисквитки (cookies). Ако желаете можете да научите повече тук.