Google запускает агентов Astra
Новый ИИ-помощник будет все видеть, все слышать и все запоминать
Google во вторник анонсировала новый проект в сфере искусственного интеллекта — Project Astra. Эти агенты должны стать полноценными помощниками пользователя. И по заверениям компании они смогут не только вести беседу с пользователем и составлять многоступенчатые планы для выполнения задачи, но и запоминать все, что они уже видели и слышали.
Вслед за OpenAI свои новинки в сфере разработки искусственного интеллекта представила Google. Среди них оказались новые поколения уже существующих семейств языковых моделей — Gemini 1.5 Flash и Gemma 2, а также совершенно новый продукт — Project Astra.
«Мы всегда хотели разработать универсальных агентов на базе искусственного интеллекта, которые могли бы быть полезны в повседневной жизни,— говорится в сообщении Google.— Чтобы быть по-настоящему полезным, агент должен понимать сложный и динамичный мир и реагировать на него так же, как это делают люди, то есть воспринимать и запоминать то, что он видит и слышит, чтобы понимать контекст и принимать меры».
Project Astra — мультимодальная модель, которая может анализировать звук, изображение и текст в режиме реального времени. Она способна вести беседу, как человек, то есть реагировать на интонации и на то, что ее перебивают.
Google намерена выпустить Astra в виде приложения для камеры смартфона, а затем персональных компьютеров, умных очков и других гаджетов.
В демонстрационном ролике Astra распознает и запоминает предметы, которые попадают в объектив камеры смартфона во время использования помощника, а по запросу выдает пользователю краткую информацию о них. Помощник способен решать логические задачи, «видя» их условия, а также демонстрирует навыки ассоциативного мышления.
При этом новая разработка Google по сути делает все то же самое, что и GPT-4o, представленная OpenAI на день раньше. Правда, GPT-4o уже доступна пользователям ChatGPT, а когда агенты Astra смогут помогать пользователям сервисов Google — пока не известно.
Эксперты отмечают, что корпорации-лидеры на рынке ИИ в условиях жесткой конкуренции часто выпускают сырые продукты, стремясь представить публике что-то новое как можно быстрее.
Так, один из разработчиков ИИ-инструментов охарактеризовал бОльшую часть деятельности в этой сфере как «массу “дутого” ПО (vaporware — так называют ПО, о разработке которого много говорят, но которое в итоге не выпускается.— “Ъ”) и шумихи». По его словам, каждые две недели объявляется о каких-то громких новинках, но по факту есть ощущение, что все делают одно и то же.