Мы применяем куки на сайте, вы соглашаетесь на использование файлов cookie. Подробнее
OK
Все статьи ОБ ИИ в KolerskyAI
Раздел про децентрализованный ИИ

Что дальше с ИИ? Каким будет развитие Нейросетей в будущем?

В 2026 году самые умные модели искусственного интеллекта могут оказаться не самыми большими.
Именно на это сейчас делают ставку лаборатории, инвесторы и исследователи, которые весь прошлый год наблюдали, как рушатся их предположения. Предстоящие 12 месяцев будут определяться не гонкой за созданием более крупных систем, а борьбой за разработку более мудрых, моделей, которые думают, прежде чем говорить, которые делают больше меньшими затратами.
Создано нейросетью в сервисе Nano Banana от KolerskyAI
Год назад это прозвучало бы как ересь. В течение десятилетия ИИ действовал в соответствии с жестоко простым катехизисом: больше данных, больше параметров, больше вычислительной мощности, больше интеллекта. Лаборатории соревновались в подсчете параметров, подобных тому, как бодибилдеры разминаются перед зеркалом. Тренировочные пробежки потребляли электроэнергию небольших городов. У всего предприятия было ощущение стремительного роста, за исключением того, что заявленная территория измерялась в терафлопсах.
Затем наступил январь 2025 года. Компания DeepSeek, базирующаяся в Китае, выпустила модель, из-за которой акции Nvidia упали на 17% за один день. Алгоритмический ум может заменить грубую вычислительную силу. Вам не нужен был собор. Вам нужен был план получше.

Крупнейшие американские лаборатории быстро менялись. В течение нескольких месяцев они перешли от создания все более крупных систем к созданию систем, которые делают паузу и размышляют, прежде чем ответить. Сейед Эмади, адъюнкт-профессор операционных процессов Университета Северной Каролины Кенан-Флэглер'а, прямо сказал в беседе с IBM Think: “Если бы мне пришлось подводить итоги 2025 года в области ИИ, мы перестали делать модели больше и начали делать их более разумными”.

Этот поворот определяет то, что будет дальше. Консенсус среди исследователей поразителен, почти жутковат. Когда его попросили назвать наиболее значимые разработки прошлого года, Миша Белкин, профессор машинного обучения Калифорнийского университета в Сан-Диего, указал на “рост моделей мышления и масштабирования во времени вывода” — и в интервью назвал это основой на 2026 год. Рада Михалча, которая руководит лабораторией ИИ в Мичиганском университете, предложила дополнительную точку зрения: “достижения в области многоагентных систем, а также более глубокое понимание ... ” слабые стороны" определят дальнейший путь, - сказала она IBM Think.

Этот сдвиг представляет собой переосмысление того, что означает интеллект в кремнии. Старый подход рассматривал его как нечто, что вы добавляете во время обучения, как приправу к рагу. После завершения модель замораживали. Новый подход рассматривает интеллект как нечто, что может проявиться во время выполнения, если дать модели больше времени на рассуждения, называемое вычислением времени вывода.
Последствия все еще прорабатываются. Габриэль Поэзия, исследователь, изучающий рассуждения ИИ в Стэнфордском университете, наблюдал, как модели улучшают “мышление в течение более длительных периодов времени” и "беспрепятственно используют инструменты в течение длительных периодов раздумий”. Версия на простом английском: машины научились думать, прежде чем говорить.

Старые модели работали как рефлексы: ввод данных, вывод прогнозов, никаких пауз на раздумья. Новые продуманны. Задайте сложный вопрос, и модель посидит с ним, иногда несколько минут, проверяя логику, возвращаясь из тупика. Это удивительно похоже на мышление. Вопрос о том, является ли он мышлением в каком-либо значимом смысле, остается одним из величайших вопросов без ответа.

Меньше, быстрее, дешевле

Если модели мышления были интеллектуальной историей 2025 года, коммерческая сенсация была более грубой: ИИ frontier оказался намного дешевле, чем кто-либо думал. Экономика, которая казалась такой же неизменной, как гравитация, оказалась больше похожей на моду. Это открытие изменит конкуренцию в 2026 году.

Январский релиз DeepSeek произвел эффект разорвавшейся бомбы. Модель соответствовала западным системам, используя примерно одну десятую тренировочных вычислений. “Это подтолкнуло события”, - сказал Варшни. “Теперь появился еще один конкурент, и каждому нужно улучшить свою игру”.

Архитектура модели претерпела собственные незаметные изменения. Новый актуальный шаблон, состоящий из нескольких экспертов, направляет входные данные в специализированные подсети вместо того, чтобы активировать каждый параметр для каждого запроса. Думайте об этом как о консультации с нужным специалистом, а не как о том, чтобы просить одного врача знать все. Эндрю Чин, профессор права в UNC, изучающий технологическую политику, объяснил экономику IBM Think: “Плотные модели требуют примерно одинаковых вычислительных затрат для каждого токена”, - сказал он. “Разреженные системы маршрутизируют токены только через подмножество параметров”. Для предприятий важен вывод: “Масштабирование становится чем-то, чем нужно управлять, а не просто максимизировать”.

Демократизация распространяется не только на архитектуру, но и на тонкую настройку. Кристель Шарфф, профессор компьютерных наук в Университете Пейс, рассказала IBM Think, что она стала свидетельницей “явного сдвига в сторону LoRa и легкой тонкой настройки, позволяющей адаптировать мощные модели с ограниченными вычислительными возможностями”. Исследователи со скромными бюджетами теперь могут настраивать модели, которые год назад были бы недоступны. Ворота открываются.

Повышение эффективности также включает в себя проектирование систем.Кандайс Бреннан, доцент Школы медсестер UNC, которая работает над ИИ в здравоохранении, рассказала IBM Think, что подходы похожи на планировщик учеников MIT — где “большая модель планирует и координирует ... ”множество небольших моделей" — достижение результатов при “гораздо меньших вычислительных затратах”. Эффективность также снижает потребление энергии и нагрузку на окружающую среду.

“Ограничения данных и проблемы с энергопотреблением теперь стали реальной проблемой, - сказал Михалча, - что подтолкнуло исследования в направлении создания моделей меньшего размера”. Эти ограничения будут только ужесточаться.

Оказывается, предприятиям на самом деле нужна не способность делать все, сказал Варшни. Он привел причудливый пример: вы могли бы попросить модель прокомментировать гражданские права на Луне, и она выдала бы нечто беглое. “Но большинство корпоративных задач не таковы”, - сказал он. “Они становятся более целенаправленными”. Теология масштаба уступает место прагматизму соответствия целям.

Уверенность и заблуждения

Успехи были реальными. Так же как и пределы. Несмотря на новообретенную способность к обдумыванию, модели искусственного интеллекта по-прежнему способны к ошибкам особого рода: уверенным ошибкам, совершаемым с безмятежной уверенностью экскурсовода, забредшего не в тот музей.

Poesia определила основные проблемы: “Двумя основными вызовами по-прежнему остаются надежность и креативность. Даже успеха в 99,9% случаев недостаточно”, - сказал он. Математика неумолима. Система, которая дает сбой один раз из тысячи попыток, не сможет обработать миллион запросов тысячу раз. В медицине, юриспруденции или финансах это неприемлемые коэффициенты.

Креативность - это еще одна проблема. “Для открытых задач ... даже модели от разных компаний, как правило, дают схожие результаты”, - заметила Поэзия. Модели стали удивительно хороши в поиске правильных ответов. Они остаются странно единообразными, когда их просят быть оригинальными.

У моделей рассуждений есть свои слепые зоны. Варшни отметил, что “в задачах, где есть возможность проверять промежуточные этапы ... эти более длительные потоки помогают. Но есть масса вещей, в которых нет промежуточных проверяемых шагов.”

Бенчмарк под названием ARC-AGI-2 иллюстрирует разрыв. В тесте представлены проблемы, которые люди находят простыми, а ИИ - чрезвычайно сложными. “Даже самые современные модели мышления оцениваются намного ниже производительности человека”, - сказал Эмади. “Модели могут рассуждать лучше, чем раньше, но они все равно могут быть заведомо ошибочными”.

Галлюцинации, которые в этой области принято называть выдумкой, изменились в том, как они проявляются, но все еще остаются. Мохаммад Хоссейн Джаррахи, профессор UNC, изучающий взаимодействие человека и ИИ, сказал IBM Think, что “галлюцинации изменили характер, но не исчезли полностью”. Тенденция генерировать правдоподобно звучащую, но фактически неверную информацию остается упрямо сохраняющейся.

Некоторых исследователей беспокоит более широкая траектория. Тодд Чернер, который руководит образовательной технологической программой в Университете Северной Каролины, сказал IBM Think, что “расширяющиеся возможности агентов искусственного интеллекта являются провокационными. Я думаю, будущее за AGI быстрее, чем люди думают. Мы должны хорошо использовать то, что у нас есть, прежде чем действительно настаивать на AGI ”.

Основополагающий принцип вычислительной техники по-прежнему остается в силе. “Мусор внутри, мусор снаружи”, - сказала IBM Think Натали Фолькхаймер, специалист по взаимодействию с пользователями в RENCI. “Мы фокусируемся на машине, производящей сосиски, а не на самой сосиске. Но в конце концов мы едим то, что сами готовим ”.

Решение проблемы доверия

Еще одним достижением, о котором не объявили: расширение контекстных окон, объема информации, которую модель может хранить в рабочей памяти. “Мы видим гораздо лучший контекст в масштабе хранилища, примерно до миллиона токенов”, - сказал Джаррахи.
Миллион токенов - это примерно несколько романов. По его словам, модели теперь могут поддерживать согласованное понимание в гораздо более длительных взаимодействиях, что чрезвычайно важно для анализа юридических документов, разработки программного обеспечения и обобщения результатов исследований.

Функции цитирования также улучшились, появились “встроенные ... обосновывающие функции, которые могут указывать на конкретные отрывки”, добавил Джаррахи. Когда модель может продемонстрировать свою работу, пользователи могут скорее проверить, чем принять на веру. Доверяй, но проверяй. Или скорее: не доверяй, но обязательно проверяй.
Од Олива, директор лаборатории искусственного интеллекта MIT-IBM Watson
Но пока верификация ничего не дает. Од Олива, директор лаборатории искусственного интеллекта MIT-IBM Watson, сказала IBM Think, что “будущее сотрудничества искусственного интеллекта и человека - это диалог. Искусственная агентская система должна обладать некоторой степенью теории мышления. Понимание внутренней работы системы ИИ ... формирует основу доверия ”. Теория разума — способность понимать, что у других людей другие точки зрения — имеет фундаментальное значение для взаимодействия людей. Ее отсутствие в ИИ создает трения, которые не могут преодолеть никакие возможности.

Показатели успеха меняются соответствующим образом. “Отрасль неумолимо движется к моделям, оцениваемым не столько по простоте использования, сколько по отслеживаемости, калибровке и надежности взаимодействия”, - сказал Джаррахи. Показатели гламура уступают место показателям надежности. Flash уходит в прошлое. Появляется предсказуемость.

“Доминирующей темой были возможности через ограничения”, - сказал Чин. “Вместо того, чтобы рассматривать масштабирование как самоцель, ведущие усилия сосредоточены на том, чтобы заставить системы работать предсказуемо в реальных условиях”. Прогресс выглядит не как выстрел в цель, а скорее как инженерная проблема.

Три стены смыкаются

Три ограничения будут определять, что организации смогут делать с ИИ в 2026 году, сообщил ряд экспертов IBM Think. Первое - экономическое, второе - физическое и третье - нормативное.

Начните с денег. “Экономика логического вывода будет все чаще выступать в качестве жесткого потолка”, - сказал Чин. “Многие недавние достижения в области логического анализа зависят от существенно большего объема вычислений на запрос”. Модель, на обдумывание которой уходят минуты, не может быть развернута там, где требуются масштабные реакции в режиме реального времени, отметил он.

Физические ограничения не менее устрашающи. “По прогнозам, к 2030 году потребление электроэнергии в глобальных центрах обработки данных более чем удвоится”, - сказал Эмади. “В следующем году ограничением для многих организаций будет не доступность чипов, а гигаватты для их подключения”. Отрасль годами была одержима чипами. Узким местом становятся электростанции.

“Требования к вычислениям и, следовательно, экологические издержки остаются высокими, - добавил Бреннан, - что поднимает важные этические вопросы устойчивого развития”. Углеродный след ИИ стало невозможно игнорировать.

Затем последует регулирование. “Давление со стороны руководства проектом будет более непосредственно влиять на разработку моделей”, - сказал Чин. “Для многих развертываний требуется не только высокая производительность, но и проверяемое и ограниченное поведение”. Эпоха черных ящиков, возможно, подходит к концу.

Растущий разрыв между промышленностью и академическими кругами беспокоит некоторых наблюдателей. “Университеты должны переориентироваться на фундаментальный ИИ, - сказал Шарфф, - и инвестировать в идеи, которые будут определять отрасль через 10-20 лет”. Крупнейшие модели все чаще выходят за рамки академической досягаемости, что вызывает неудобные вопросы о том, откуда возьмутся идеи следующего поколения.

Об одной разработке не сообщалось: о появлении суверенного ИИ. “Во многих странах люди разрабатывают свои собственные модели”, - сказал Варшни. Это важно, потому что данные об обучении в большей степени учитывают культурные особенности, и они смещают экономический контроль ближе к дому, отметил он.

В 2026 году Варшни ожидает продолжения экспериментов, а не кардинальных прорывов. “Не все должно быть в точности трансформированным”, - сказал он. Михалча предложил аналогичный прогноз: “меньшее специализированное сочетание экспертных моделей с использованием мультиагентных систем”. Когда его спросили, грядут ли большие скачки, Варшни был осторожен. “Шанс есть всегда...еще один неприятный момент в разговоре”, - сказал он. “Но я этого не ожидаю”. Честный ответ заключается в том, что никто не знает.

Специалисты-практики уже адаптируются к этому новому ландшафту.Джаяшанкар Сваминатан, профессор глобальных операций университета Кенан-Флэглер, сказал IBM Think, что “самые большие достижения связаны с ... автономными агентскими возможностями, когда ИИ теперь способен выполнять несколько задач в простом порядке. Второй касается обоснования логики, лежащей в основе принятия решений.”

В здравоохранении преобразования уже идут полным ходом. Морин Бейкер, клинический адъюнкт-профессор Школы медсестер UNC, рассказала IBM Think, что “модели искусственного интеллекта развиваются невероятными темпами”. Но она отличала способность от внедрения: “Критическое мышление, клинические рассуждения и суждения должны оставаться на переднем крае”. Ее подход прагматичен: “Я стремлюсь к легким победам с минимальным риском”.

Экосистема меняется. Дэвид Сакс, профессор информационных технологий в Университете Пейса, сказал IBM Think, что “похоже, появляются модели двух типов: большие, мы можем сделать все, и более сфокусированные, такие как Julius или Perplexity”. По мере того, как программное обеспечение эволюционировало от монолитных приложений к специализированным инструментам, ИИ фрагментируется по нишам.

“Фактическое использование этих систем ... формируется ... путем разработки симбиотических рабочих процессов”, - сказал Джаррахи. Люди привносят суждения, креативность и ответственность. Искусственный интеллект обеспечивает скорость, согласованность и способность обрабатывать огромные объемы информации. Организации, которые придумают, как их объединить, получат преимущество.

“Передовой ИИ уходит от эпохи, определяемой необработанным масштабированием, - сказал Чин, - к эпохе, определяемой процедурами, ограничениями и операционными компромиссами”. Технологии развиваются, когда инженеры начинают оптимизировать с учетом реальных ограничений. По этим показателям ИИ наконец-то растет.
Но Варшни думает о чем-то более глубоком, чем технология. “Какие задачи будут делегированы системам ИИ и какие из них люди продолжат выполнять?” - спросил он. “Это потому, что люди находят смысл ... в выполнении определенных вещей? Что значит быть человеком во многих отношениях?”
Вы можете получить небольшую языковую модель, работающую на том же уровне или даже лучше, чем гораздо более крупные модели

Куш Варшни, сотрудник IBM

Все статьи ОБ ИИ в KolerskyAI
Раздел про децентрализованный ИИ
Ещё статьи