Главное меню » Alibaba выпустила новый генеративный ИИ, способный понимать сложные изображения и вести диалог

Alibaba выпустила новый генеративный ИИ, способный понимать сложные изображения и вести диалог

Новые модели представляют собой значительный шаг вперед в развитии мультимодального ИИ, способного обрабатывать как визуальные, так и текстовые данные на английском и китайском языках.

Редакция
0 коммент. 69 просм. 3 мин. на чтение

Китайский технологический гигант Alibaba представил две новые генеративные модели искусственного интеллекта Qwen-VL (Qwen Large Vision Language Model) и Qwen-VL-Chat, демонстрирующие расширенные возможности интерпретации изображений и ведения естественных диалогов.

Учитывая растущий спрос на более совершенные возможности искусственного интеллекта, новые модели Alibaba приходятся как нельзя кстати. Новые модели не ограничиваются только пониманием текста: Qwen-VL способен воспринимать и понимать изображения, текст и ограничивающие рамки. Он может обрабатывать открытые запросы, связанные с различными изображениями, и генерировать соответствующие подписи. Но на этом его возможности не заканчиваются.

Его собрат, Qwen-VL-Chat, предназначен для более сложных взаимодействий. Например, он может сравнивать несколько изображений, отвечать на несколько раундов вопросов и даже писать истории или создавать изображения на основе предоставленных пользователем фотографий. Представьте себе, что вы спрашиваете ИИ о расположении больницы на основе фотографии ее вывески и получаете точный ответ – вот уровень сложности, который обещает Alibaba.

Одним из главных достоинств этих моделей является их высокая производительность. По данным Alibaba, Qwen-VL значительно превосходит существующие открытые языковые модели Large Vision Language Models по нескольким эталонам оценки английского языка.

Кроме того, в модели реализована новая функция “многоизобразительные чередующиеся разговоры”, которая позволяет пользователям взаимодействовать с моделью, используя несколько изображений и задавая вопросы, связанные с этими изображениями. Что еще более важно, это одна из первых универсальных моделей, поддерживающая “заземление” на китайском языке, что предполагает обнаружение ограничивающих границ с помощью языковых выражений открытого типа как на китайском, так и на английском языках.

Используя набор стандартных эталонов, компания Alibaba оценила возможности моделей в ряде задач, начиная от создания подписей к изображениям с нулевого снимка и заканчивая ответами на визуальные вопросы на основе текста. Модели также тестировались с помощью разработанного Alibaba эталона TouchStone, который основан на оценке с помощью GPT-4 для определения диалоговых возможностей модели и ее соответствия человеческому пониманию. Результаты? Qwen-VL и Qwen-VL-Chat достигли наилучших результатов по нескольким категориям, включая вопросы и ответы на основе атрибутов, распознавание знаменитостей и решение математических задач.

Будучи одной из первых китайских компаний, представивших конкурентоспособную систему генеративного ИИ, Alibaba выпустила Qwen-VL и Qwen-VL-Chat, что свидетельствует о быстром прогрессе Китая в области исследований ИИ. Выпустив эти модели с открытым исходным кодом, Alibaba гарантирует, что исследователи, ученые и компании по всему миру смогут использовать их для разработки собственных приложений, не прибегая к трудоемкой и дорогостоящей процедуре обучения моделей с нуля. Это стратегический шаг, который перекликается с более широкой тенденцией в области ИИ к сотрудничеству и совместному использованию ресурсов.

Этот запуск происходит на фоне жесткой конкуренции между технологическими гигантами за лидерство в гонке ИИ. Компании – от Google Bard до Anthropic Claude – участвуют в гонке вооружений в области ИИ, стремясь разработать все более совершенные генеративные модели, имеющие последствия для бизнеса, общества и геополитики. Благодаря тому, что Qwen-VL и Qwen-VL-Chat демонстрируют высокие навыки работы с общим интеллектом, компания Alibaba и Китай заявили о себе на этой глобальной арене ИИ с высокими ставками. Это смелое заявление компании и напоминание о том, что она является не только гигантом розничной торговли, но и грозным игроком в мире ИИ.

Этот сайт использует файлы cookie для улучшения вашего опыта. Мы будем считать, что вы согласны с этим, но при желании вы можете отказаться. Принять Подробнее