Мультимодальность как новый стандарт
Если в 2023-2024 годах топовые ИИ-модели работали в основном с текстом, то в 2025 мультимодальность стала стандартом. GPT-5o, Claude 4 и Google Gemini Ultra 2.0 native работают с текстом, изображениями, видео, аудио и 3D-моделями в единой архитектуре. Это открыло новые возможности: ИИ может анализировать видео с камер наблюдения в реальном времени, создавать полноценные презентации по голосовой команде и даже генерировать интерактивные 3D-сцены.
На практике это означает, что теперь можно загрузить в нейросеть часовую запись совещания и получить не только полную расшифровку, но и выделенные ключевые решения, эмоциональную карту участников и даже предложенную структуру протокола. Рынок инструментов мультимодального ИИ вырос до $25 млрд за 2025 год.
Агентный ИИ (AI Agents)
Самый горячий тренд года — агентный ИИ. Это модели, которые не просто отвечают на запросы, а самостоятельно планируют цепочку действий, используют инструменты (браузер, API, калькулятор, базы данных) и достигают поставленных целей. Например, агент-исследователь может самостоятельно найти 10 конкурентов, проанализировать их ценовую политику, составить отчёт и отправить его по электронной почте — всё без вмешательства человека.
Ключевые игроки в этой нише: OpenAI (Operator), Anthropic (Computer Use), Google (Project Mariner) и стартапы типа Adept и Contextual AI. Рынок AI-агентов оценивается в $10 млрд, и, по прогнозам Gartner, к 2027 году 30% всех корпоративных задач будут выполняться агентным ИИ.
Регуляторные вызовы
AI Act в Европе вступил в полную силу, и первые штрафы уже выписаны. Классификация ИИ-систем по уровню риска («неприемлемый», «высокий», «ограниченный», «минимальный») создала прецедентное поле. Крупные технологические компании начали активнее раскрывать данные об обучении моделей — какие датасеты использовались, как обрабатывались персональные данные.
В США иски о нарушении авторских прав против OpenAI, Microsoft и Stability AI перешли в стадию судебных разбирательств. The New York Times, Getty Images и группа авторов требуют компенсаций за использование их контента для обучения. Исходы этих дел определят будущее генеративного ИИ на годы вперёд. В России обсуждается собственный закон об ИИ, ориентированный на этические нормы и безопасность.
Экономика ИИ: от затрат к прибыли
Год назад главной проблемой были огромные затраты на обучение и инференс (выполнение запросов). В 2025 ситуация изменилась: снижение стоимости благодаря оптимизации архитектур (Mixture of Experts, квантизация) и появлению специализированных чипов. Стоимость инференса GPT-4-уровня упала в 20 раз по сравнению с 2024.
Это привело к массовому внедрению ИИ в бизнес. По данным McKinsey, 65% компаний из Fortune 500 используют генеративный ИИ хотя бы в одном бизнес-процессе. Экономический эффект оценивается в $200 млрд в 2025 году. Лидеры внедрения: поддержка клиентов (чат-боты обрабатывают 80% запросов), разработка ПО (Copilot ускоряет написание кода на 40-50%), маркетинг (генерация контента и персонализация).
Специализированные модели vs гиганты
Интересный тренд 2025 — рост популярности специализированных моделей. Вместо использования GPT-5 для всего подряд компании начали обучать или дообучать небольшие модели (7-70 млрд параметров) под конкретные задачи. Такие модели в 10 раз дешевле в эксплуатации, быстрее работают и могут быть развёрнуты локально (что критично для финансового сектора и госорганов).
Примеры: BloombergGPT для финансового анализа, Med-PaLM 3 для медицинских диагнозов, CodeStable для программирования. Meta выпустила Llama 4 — модель с открытым весом, которая по качеству сравнима с закрытыми аналогами, но может запускаться на одном сервере. Эта модель стала основой для тысяч корпоративных дообучений.
Гонка на энергоэффективность
Обучение больших моделей потребляет колоссальное количество электроэнергии. GPT-5 обучили за 3 месяца, потратив 500 ГВт·ч — столько же, сколько 50 000 домов за год. Это вызвало общественную критику. Компании пошли по пути оптимизации: Google внедрила охлаждение центров обработки данных (ЦОД) на основе ИИ, Microsoft строит ЦОД рядом с АЭС, OpenAI инвестирует в термоядерный синтез (Helion Energy).
Прогноз: к 2030 году ЦОД будут потреблять 8% мировой электроэнергии (сейчас 2%). Без прорывов в энергоэффективности это станет серьёзным ограничением для развития ИИ.
Итоги и прогнозы на 2026
- Агентный ИИ станет мейнстримом — появятся первые «цифровые работники», нанимаемые как фрилансеры.
- Регуляторные риски возрастут — вероятно появление глобального договора по ИИ (аналог Парижского соглашения по климату).
- Мультимодальные модели научатся управлять временем — генерировать и редактировать видео длительностью более 1 минуты с сохранением персонажей и сюжета.
- Специализированные модели продолжат вытеснять гигантов из узких ниш (медицина, юриспруденция, финансы).
- Интерпретируемость ИИ (объяснение, почему модель приняла то или иное решение) станет законодательным требованием в Европе.
Искусственный интеллект в 2025 году — это уже не «технология будущего», а «технология настоящего». Компании, которые не внедрили ИИ хотя бы в пилотных проектах, рискуют остаться на обочине. Следующий год станет годом борьбы за эффективность и интеграцию — кто сможет извлечь максимальную прибыль из ИИ-агентов и мультимодальных моделей, тот и выиграет.