OpenAI выпускает обновления для реального времени в области аудио, визуализации и текста
Согласно Cointelegraph, OpenAI внесла четыре обновления в свои модели в октябре, чтобы помочь своим ИИ-моделям лучше проводить разговоры и улучшить распознавание изображений. Первое крупное обновление — это API в реальном времени, который позволяет разработчикам создавать приложения для генерации речи ИИ с использованием одного запроса, обеспечивая естественные разговоры, аналогичные продвинутым речевым моделям ChatGPT. Ранее разработчикам приходилось «сшивать» несколько моделей для создания таких опытов. Аудиовход обычно должен быть полностью загружен и обработан до получения ответа, что означает, что приложения в реальном времени, такие как голосовые разговоры, имеют высокую задержку. Благодаря потоковым возможностям Realtime API разработчики теперь могут реализовать мгновенные, естественные взаимодействия, как у голосового помощника. Работая на GPT-4, который будет выпущен в мае 2024 года, API обеспечивает вывод в реальном времени по аудио, визуальным и текстовым данным. Другое обновление включает инструменты тонкой настройки для разработчиков, которые позволяют им улучшать ответы ИИ, сгенерированные на основе изображений и текстовых вводов. Настройщик на основе изображений позволяет ИИ лучше понимать изображения, что приводит к улучшенному визуальному поиску и обнаружению объектов. Процесс включает обратную связь от людей, которые предоставляют примеры хороших и плохих ответов для обучения. В дополнение к обновлениям речи и зрения, OpenAI представила «дистилляцию модели» и «кэширование подсказок», которые позволяют меньшим моделям учиться у больших и сокращать затраты и время на разработку за счет повторного использования обработанного текста. OpenAI ожидает, что доходы вырастут до 11,6 миллиарда долларов в следующем году, по сравнению с прогнозируемыми 3,7 миллиарда долларов в 2024 году, согласно Reuters.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
ETF на основе стратегии ProShares Bitcoin вырос на 1,9%
First Digital представляет свой стейблкоин FDUSD в качестве нативного токена в Sui
Всего 8409 ETH было переведено на адрес горячего кошелька CEX от Grayscale