Статьи с тегом: тестирование ИИ

Красные команды легко взломали GPT-5, предупреждая, что он "практически непригоден" для использования в бизнесе.

Безопасность | 09.08.2025 | 18:06

Новая GPT-5 оказалась уязвима к взлому: эксперты заставили модель выдать инструкции по изготовлению опасных предметов. Компании рекомендуют с осторожностью подходить к использованию необработанной версии GPT-5 и отдают предпочтение более защищенной GPT-4o.

Чат-бот ChatGPT потерпел сокрушительное поражение в шахматы, проиграв Atari 2600 образца 1970-х годов.

ИИ | 15.06.2025 | 01:12

ChatGPT проиграл шахматный матч игре Atari 1979 года, демонстрируя серьезные ошибки в распознавании фигур и базовых правилах – искусственный интеллект оказался слабее даже начального уровня. Узнайте, как нейросеть потерпела фиаско в схватке с классической игрой и какие забавные оправдания она приводила!

Неоднозначные результаты улучшенных AI-моделей Apple

ИИ | 10.06.2025 | 21:51

Apple отстает от лидеров в гонке ИИ: собственные модели уступают конкурентам в тестах на генерацию текста и анализ изображений, несмотря на последние обновления. Узнайте, почему разработки Apple не дотягивают до уровня OpenAI, Google и Meta и что это значит для пользователей.

Генеральный директор Anthropic предупреждает о срыве ставок через 10 лет и выступает против моратория на регулирование искусственного интеллекта.

ИИ | 05.06.2025 | 22:33

Основатель Anthropic предупреждает о рисках ИИ и призывает к федеральным стандартам прозрачности вместо 10-летнего моратория. Новейшая модель компании показала угрожающее поведение, а другие разработчики сообщают о схожих проблемах. Узнайте, как обязательная публикация политик тестирования может стать эффективной страховкой для национальной безопасности.

«Неминуемый сбой»: когда большие языковые модели в долгосрочной симуляции вендингового бизнеса вышли из-под контроля.

ИИ | 01.06.2025 | 01:24

Искусственный интеллект провалил бизнес-симуляцию: модели демонстрируют непредсказуемое поведение, от паники и обращения в ФБР из-за "кибератаки" до заявления о "квантовом коллапсе" бизнеса. Не рискуйте деньгами, пока ИИ не научится считать!

Как школы Майами готовят 100 000 учеников к будущему с искусственным интеллектом.

ИИ | 20.05.2025 | 01:39

Майами-Дейд, один из крупнейших школьных округов США, внедряет ИИ-чатботы Gemini для более чем 105 000 старшеклассников, открывая новую эру в образовании и следуя инициативе президента по интеграции ИИ в учебный процесс. Это масштабное развертывание поможет ученикам получить персонализированную поддержку и доступ к знаниям, а школе – оставаться на передовой образовательных технологий.

Anthropic предупреждает: полностью автоматизированные сотрудники — уже через год.

ИИ | 23.04.2025 | 03:54

В 2024 году компании внедрят ИИ-сотрудников с собственной памятью и доступом к корпоративным системам, что создаст новые риски безопасности и вопросы ответственности за их действия – эксперты Anthropic призывают к тщательному тестированию и мониторингу ИИ для предотвращения взломов и неправомерного использования.

OpenAI озадачена тем, что в новых моделях наблюдается рост числа случаев «галлюцинаций».

ИИ | 19.04.2025 | 05:31

Новые модели OpenAI склонны к "галлюцинациям" — выдаче недостоверной информации — вдвое чаще, чем предыдущие версии. Эксперты отмечают, что более продвинутые системы, такие как o3 и o4-mini, фабрикуют факты и генерируют неработающие ссылки, что требует дальнейшего изучения причин этой проблемы.

После обвинений в нечестной игре со стороны Meta, протестирована модель Llama 4 Maverick без изменений — занимает 32-е место.

ИИ | 14.04.2025 | 01:39

Meta допустила преувеличение возможностей своей новой модели ИИ "Maverick". После заявлений о превосходстве над лидерами рынка, независимые тесты показали, что "Maverick" занимает лишь 32-е место, уступая даже моделям прошлого года. Узнайте правду о возможностях ИИ и не дайте себя обмануть громкими заявлениями!

Модели искусственного интеллекта пока испытывают трудности с отладкой программного обеспечения, показало исследование Microsoft

ИИ | 11.04.2025 | 10:32

Современные модели ИИ, включая Claude 3.7 Sonnet и o3-mini, показывают скромные результаты в решении задач по отладке кода, что доказывает, что ИИ еще не может полностью заменить человеческих разработчиков.

"Gemini" появится в Google Календаре: как это будет работать и как попробовать прямо сейчас

ИИ | 12.03.2025 | 15:29

Теперь вы можете использовать искусственный интеллект Gemini для управления своим календарем Google Calendar: задавайте вопросы о событиях, планируйте встречи и получайте быстрые ответы.

После того, как режим голосового ввода ChatGPT стал бесплатным, стоит ли еще платить за ChatGPT Plus?

ИИ | 02.03.2025 | 16:51

Бесплатный голосовой режим ChatGPT теперь доступен всем, но платная версия ChatGPT Plus предлагает более мощную модель ИИ, больший лимит времени использования и дополнительные функции.

Я сравнил приложение Le Chat от Mistral AI с ChatGPT, и оно превзошло все ожидания

ИИ | 27.02.2025 | 23:12

Европейский чат-бот Le Chat от Mistral AI предлагает альтернативу ChatGPT и Google Gemini, демонстрируя впечатляющие возможности в задачах, таких как помощь в социальной жизни, решение загадок и объяснение сложных тем.

Я попробовал "Глубокие исследования" от Perplexity, и они не оправдывают исследовательский потенциал ChatGPT

ИИ | 23.02.2025 | 06:39

Новые функции Deep Research от OpenAI и Perplexity позволяют получить глубокие и структурированные ответы на сложные вопросы, анализируя огромные объемы информации в интернете.

После тестирования Copilot сотрудники правительства сочли ИИ от Microsoft менее полезным, чем они ожидали.

ИИ | 18.02.2025 | 16:01

Департамент казначейства Австралии выяснил, что Microsoft Copilot окупает вложенные средства, но сотрудники считают его менее полезным для выполнения рабочих задач, чем предполагалось. В среднем они используют ассистента 2-3 раза в неделю.