Загрузка...

Nvidia выпустила масштабный открытый европейский языковой набор данных и инструменты для работы с искусственным интеллектом.

99Опубликовано 26.08.2025 в 08:19Категория: ИИИсточник

Лишь незначительная часть из более чем 7000 языков, существующих на Земле, поддерживается моделями искусственного интеллекта", – сообщает SiliconANGLE на этой неделе. В связи с этим Nvidia объявила о выпуске масштабного нового набора данных и моделей, готовых к использованию в ИИ, для поддержки разработки высококачественной ИИ-переводческой системы для европейских языков.

Новый набор данных, получивший название Granary, представляет собой огромный открытый многоязычный аудиокорпус, включающий более миллиона часов аудиозаписей, а также 650 000 часов распознавания речи и 350 000 часов речевого перевода. Команда Nvidia по разработке ИИ для работы с речью сотрудничала с исследователями из Carnegie Mellon University и Fondazione Bruno Kessler для обработки немаркированных аудиозаписей и общедоступных данных речевого общения, преобразуя их в информацию, пригодную для обучения ИИ. Granary включает 25 европейских языков, охватывающих почти все 24 официальных языка Европейского Союза, а также русский и украинский. В наборе данных также представлены языки с ограниченным объемом доступных данных, такие как хорватский, эстонский и мальтийский. Это критически важно, поскольку предоставление этих недостаточно представленных данных, размеченных человеком, позволит разработчикам создавать более инклюзивные речевые технологии для аудитории, говорящей на этих языках, при этом используя меньше данных для обучения в своих ИИ-приложениях и моделях.

В своей исследовательской работе команда продемонстрировала, что для достижения высокой точности автоматического распознавания речи и автоматического речевого перевода требуется примерно вдвое меньше данных для обучения из Granary, чем из других популярных наборов данных.

Наряду с Granary, Nvidia также выпустила новые модели Canary и Parakeet, чтобы продемонстрировать возможности, которые можно реализовать с использованием этого набора данных. Новая модель Canary доступна под достаточно разрешительной лицензией для коммерческого и исследовательского использования, расширяя языковой охват Canary с четырех до 25 языков. Она обеспечивает качество транскрипции и перевода, сравнимое с моделями в три раза большего размера, при этом скорость вывода данных в 10 раз выше. Благодаря 1 миллиарду параметров, она может полностью работать на устройстве на большинстве флагманских смартфонов нового поколения для обеспечения перевода речи в режиме реального времени.

Интересные статьи

Нет статей для отображения

Предыдущая статья

Загрузка предыдущей публикации...

Следующая статья

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...