Статьи с тегом: распознавание речи

FFmpeg 8 теперь может добавлять субтитры к вашим видео на лету.
FFmpeg 8.0 теперь автоматически добавляет субтитры к видео благодаря интеграции Whisper и предлагает аппаратное ускорение кодирования через Vulkan – ускорьте обработку видео и сделайте контент доступнее!

Nvidia выпустила масштабный открытый европейский языковой набор данных и инструменты для работы с искусственным интеллектом.
Nvidia представила огромный набор данных Granary и новые ИИ-модели, чтобы значительно улучшить поддержку европейских языков в системах перевода и распознавания речи, требуя при этом вдвое меньше данных для обучения и обеспечивая высокую скорость работы даже на смартфонах.

Выпускники Гарварда запускают умные очки с искусственным интеллектом, которые постоянно включены, слушают и записывают каждый разговор.
Умные очки Halo X за 249 долларов с ИИ помогут вам запоминать всё и всегда быть в курсе, предоставляя информацию в реальном времени и подсказывая ответы на вопросы – как личный супер-интеллект на вашем лице. Предзаказ уже открыт – станьте одним из первых, кто получит доступ к технологиям будущего!

Mozilla официально закрывает проект DeepSpeech
Mozilla закрывает проект DeepSpeech – движок преобразования речи в текст, работавший даже на маломощных устройствах. Узнайте, почему перспективная разработка с открытым исходным кодом прекратила свое существование.

OnePlus заменяет фирменный сдвижок оповещений на кнопку искусственного интеллекта.
OnePlus внедряет AI в свои смартфоны с новой кнопкой Plus Key и функцией AI Plus Mind, способной сохранять и извлекать информацию с экрана голосом. Это позволит мгновенно фиксировать расписания, бронирования и другую важную информацию, а затем легко находить её с помощью естественного языка.

Microsoft начала тестировать функцию «Привет, Копилот!» в Windows.
Активируйте голосовое управление Copilot в Windows 11 фразой "Привет, Copilot!" и получите быстрый доступ к помощнику без использования мыши или клавиатуры. Новая функция уже доступна участникам программы Windows Insiders и обеспечивает конфиденциальность – обработка голоса происходит локально, без отправки данных в облако. Обновите Copilot до версии 1.25051.10.0 или выше и попробуйте сами!

UbiSoft открыла исходный код своего инструмента помощи для дальтоников Chroma.
Улучшите доступность ваших игр! Ubisoft открыла исходный код Chroma – инструмента для имитации различных типов дальтонизма, позволяющего выявить проблемы с цветовосприятием на ранних стадиях разработки и сделать ваши игры комфортными для всех игроков. Скачайте бесплатно и начните создавать инклюзивные игры уже сегодня!

Apple исправляет ошибку распознавания голоса, которая заменяет "расист" на "Трамп".
Функция голосового ввода на iPhone ошибочно заменяет слово "расист" на "Трамп", Apple признала проблему и работает над ее исправлением.

Meta и ЮНЕСКО объединились, чтобы улучшить искусственный интеллект в области перевода.
Meta и ЮНЕСКО запускают новую программу по совершенствованию технологий перевода и распознавания речи, с упором на поддержку малораспространенных языков, таких как инуктитут и инуиннактун в канадском Нунавуте.