Отчёт по AI-индустрии за 2026-03-02: события, тренды, структурные сдвиги

Ежедневный анализ новостей AI-индустрии через призму 9-уровневой Системы Разделения Труда. Событий: 24.

Уровень 9. Денежная система

капитал и оценка будущей ренты перераспределяются в сторону «второго контура» AI-инфры (interconnect/optics), а не только GPU

капитал и оценка будущей ренты перераспределяются в сторону «второго контура» AI-инфры (interconnect/optics), а не только GPU. Инвестиция Nvidia - форма *инфраструктурного CapEx как финансового оружия* в гонке за throughput и масштабом.

Источники: источник

коммерческая рента LLM все больше зависит от SLA/аптайма, а значит - от финансируемого CapEx и контрактов на compute/сеть

коммерческая рента LLM все больше зависит от *SLA/аптайма*, а значит - от финансируемого CapEx и контрактов на compute/сеть. Сильный спрос без устойчивости превращается в финансовый риск (churn, штрафы, потеря доверия).

Источники: источник

финсектор начинает рассматривать AI как производственную мощность для альфы/скорости/снижения издержек, что меняет денежные потоки: бюджеты и таланты перетекают в AI-инфраструктуру и data/agent stack внутри банков

финсектор начинает рассматривать AI как *производственную мощность* для альфы/скорости/снижения издержек, что меняет денежные потоки: бюджеты и таланты перетекают в AI-инфраструктуру и data/agent stack внутри банков.

Источники: источник

формируется альтернативный центр капитализации и коммерциализации AI внутри китайского рынка (свой спрос, свои правила, свои каналы финансирования)

формируется альтернативный центр капитализации и коммерциализации AI внутри китайского рынка (свой спрос, свои правила, свои каналы финансирования).

Источники: источник

Уровень 8. Спонтанный порядок

усиливается неформальный стандарт «кто контролирует interconnect - тот контролирует производительность кластера», что начинает собирать экосистему вокруг Nvidia уже как архитектора датацентров, а не только поставщика ускорителей

усиливается неформальный стандарт «кто контролирует interconnect - тот контролирует производительность кластера», что начинает собирать экосистему вокруг Nvidia уже как *архитектора датацентров*, а не только поставщика ускорителей.

Источники: источник

доверие как институт «спонтанного порядка» начинает включать метрику операционной надежности модели (не только качество ответов)

доверие как институт «спонтанного порядка» начинает включать метрику *операционной надежности модели* (не только качество ответов). Параллельно появляются протоколы/бенчмарки и «живые» хранилища атак, чтобы стандартизировать безопасность и надежность (Jailbreak Foundry).

Источники: источник

усиливается «рынок доверия к машинным решениям» через бенчмарки, симуляторы и процедуры воспроизводимости (например, TradeFM интегрируется с детерминированным симулятором рынка)

усиливается «рынок доверия к машинным решениям» через бенчмарки, симуляторы и процедуры воспроизводимости (например, TradeFM интегрируется с детерминированным симулятором рынка).

Источники: источник

«спонтанный порядок» китайского open-source/моделей как ответ на ограничения и конкуренцию - подтверждается обсуждением «что дальше у китайского open-source AI»

«спонтанный порядок» китайского open-source/моделей как ответ на ограничения и конкуренцию - подтверждается обсуждением «что дальше у китайского open-source AI».

Источники: источник

доверие/репутация как координационный механизм начинает рушиться: появляется уличная политика вокруг AI, что повышает вероятность регуляторных/корпоративных ограничений

доверие/репутация как координационный механизм начинает рушиться: появляется уличная политика вокруг AI, что повышает вероятность регуляторных/корпоративных ограничений.

Уровень 7. Институты производства знаний

знание оформляется в виде доменных foundation models (микроструктура, трейд-ивенты) - это превращает ранее «ремесленную» экспертизу квантов в тиражируемый актив

знание оформляется в виде доменных foundation models (микроструктура, трейд-ивенты) - это превращает ранее «ремесленную» экспертизу квантов в тиражируемый актив.

Источники: источник

происходит институционализация «локальных бенчмарков/локальной мультимодальности» (например, SEA-ориентированный omni-модельный стек)

происходит институционализация «локальных бенчмарков/локальной мультимодальности» (например, SEA-ориентированный omni-модельный стек).

Источники: источник

акцент на «что реально» в сети (инициативы по проверке реальности/AI-контента) - попытка восстановить институты доверия

акцент на «что реально» в сети (инициативы по проверке реальности/AI-контента) - попытка восстановить институты доверия.

Источники: источник

Уровень 6. Технологии производства знаний

исследовательская повестка «test-time compute scaling» и «adaptive routing» (ODAR) - это про экономию дефицитного ресурса кластера и сети, а не только про качество модели

исследовательская повестка «test-time compute scaling» и «adaptive routing» (ODAR) - это про экономию дефицитного ресурса кластера и сети, а не только про качество модели.

Источники: источник

фокус на cost-aware agentic systems и эффективности tool-use (HotelQuEST; ODAR; keyword-search agentic RAG)

фокус на cost-aware agentic systems и эффективности tool-use (HotelQuEST; ODAR; keyword-search agentic RAG). Это прямой ответ на стоимость инференса и перегрузки.,

Источники: источник · источник · источник

модель-центричный подход дополняется симуляцией/сценариями/контрфактами (в т.ч

модель-центричный подход дополняется симуляцией/сценариями/контрфактами (в т.ч. в финансах: Portfolio RL с scenario-context rollout).

Источники: источник

Уровень 5. Разделение труда между фирмами

Nvidia двигается к вертикализации всей AI-фабрики: GPU + interconnect + эталонные «системы»

Nvidia двигается к вертикализации всей AI-фабрики: GPU + interconnect + эталонные «системы». Инвестиции в optics - захват смежного узла цепочки стоимости «обучение/инференс → сеть → стойка → ДЦ».

Источники: источник

конкуренция смещается от «чья модель умнее» к «кто держит нагрузку и даёт предсказуемую стоимость/задержку»

конкуренция смещается от «чья модель умнее» к «кто держит нагрузку и даёт предсказуемую стоимость/задержку». Одновременно Amazon демонстрирует «экстремальные AI-траты», которые рынок уже начинает наказывать (акции/оценки) - конфликт финансовой дисциплины и гонки за capacity.

Источники: источник

Уровень 4. «Железные» технологии

оптика становится частью «железного стандарта» для AI (пропускная способность/латентность/энергия)

оптика становится частью «железного стандарта» для AI (пропускная способность/латентность/энергия). Параллельно в исследованиях - практики ускорения и управления памятью (KEEP) как ответ на стоимость токена и задержки.

Источники: источник

JPMorgan: генеративный AI «трансформирует то, как работает кредитный рынок» и работу кредит-трейдеров из-за способности обрабатывать неструктурированные данные.,

JPMorgan: генеративный AI «трансформирует то, как работает кредитный рынок» и работу кредит-трейдеров из-за способности обрабатывать неструктурированные данные.

Источники: источник · источник

На арXiv: foundation model для рыночной микроструктуры TradeFM

На арXiv: foundation model для рыночной микроструктуры TradeFM.

Источники: источник

Уровень 3. Социально-профессиональная структура

Факт-ядро: крупная анти-AI акция в Лондоне у хаба King’s Cross, где офисы OpenAI/Meta/DeepMind

Факт-ядро: крупная анти-AI акция в Лондоне у хаба King’s Cross, где офисы OpenAI/Meta/DeepMind. 🔴 Верхние уровни:

Источники: источник

Уровень 2. Пространственная организация

атаки/инциденты и геориски напрямую бьют по «географии вычислений»: сбой AWS из-за попадания «объектов» в датацентр в ОАЭ показывает, что ДЦ становятся элементом критической инфраструктуры и уязвимостью

атаки/инциденты и геориски напрямую бьют по «географии вычислений»: сбой AWS из-за попадания «объектов» в датацентр в ОАЭ показывает, что ДЦ становятся элементом критической инфраструктуры и уязвимостью.

Источники: источник

Уровень 1. Природные ресурсы

Структурные сдвиги

AI-фабрика: от GPU-монополии к системной инфраструктурной войне (optics + interconnect + SLA)

От: доминирования узкого дефицита «GPU как главный лимит».

К: конфигурации, где лимит - *связность кластера, память/кэш, латентность, отказоустойчивость*, а значит критичны optics/interconnect и эксплуатация.

Через: Nvidia капиталом заходит в optics (Ур.9→5→4), исследования смещаются в efficiency (Ур.6), а сбои/геориски делают надежность платной метрикой (Ур.2/8).

От ‘модели’ к ‘агентной операционной системе’: tool-use, протоколы, бенчмарки эксплуатации

От: оценки по статическим бенчмаркам и продажи API как «черного ящика».

К: агентным стекам со стандартизированными инструментами/протоколами и lifecycle-валидацией «в поле».

Через: MCP-экосистема требует новых датасетов для tool retrieval (HumanMCP), появляются living-бенчмарки безопасности (JBF), и фреймворки оценки реальных эффектов (CIRCLE).

Финансы как ранний массовый потребитель agentic AI (credit/AML/microstructure FM)

От: локальных пилотов и чат-ассистентов.

К: внедрения AI как оператора процессов с доступом к неструктурированным данным, симуляторам и риск-метрикам.

Через: банки легитимируют AI как основу труда трейдера (JPMorgan), параллельно возникает слой доменных foundation models (TradeFM) и агентных комплаенс-систем.

Сигналы на радаре

Политизация AI в городских хабах

(Лондон) - сигнал вероятного усиления ограничений/лицензирования/компенсационных механизмов для индустрии.

«Живые» бенчмарки безопасности

JAILBREAK FOUNDRY как инфраструктура, которая может стать индустриальным стандартом для закупок/аудита.

Снижение “обязательности” vector DB в RAG

работа про keyword-search agentic tool-use (~90% от RAG) - потенциально ломает часть рынка векторных баз/интеграторов.

Adaptive routing / Fast-Slow агенты

(ODAR) - превращение вычислительного бюджета в управляемый ресурс (как CPU scheduler, но для reasoning).

Физические угрозы датацентрам

(инцидент AWS UAE) - ранний сигнал необходимости «физической безопасности ДЦ» как части облачного продукта.

Энергетическая/логистическая волатильность из-за Ирана

как фактор переоценки географии ДЦ и supply chain.

Тренд	Momentum	Категория
AI-CapEx / инфраструктурная гонка (включая optics/interconnect)	+85	accelerating
Надежность LLM как продукт (SLA/аптайм/устойчивость)	+70	accelerating
Agentic AI в enterprise (tool-use, MCP, стандартизация)	+60	emerging
AI в финансах (кредитные рынки, микроструктура, комплаенс-агенты)	+55	accelerating
Суверенный/региональный AI и полицентричность (Китай и др.)	+50	accelerating
“Vector DB как обязательный слой RAG”	-25	decelerating
Социальная легитимность AI (рост протестов/конфликтов)	+45	emerging
Географическая уязвимость облаков (физические инциденты/геополитика)	+40	emerging
доминирования узкого дефицита «GPU как главный лимит».	-10	decelerating
оценки по статическим бенчмаркам и продажи API как «черного ящика».	-25	decelerating
локальных пилотов и чат-ассистентов.	-25	decelerating

Отчёт по AI-индустрии за 2026-03-02: события, тренды, структурные сдвиги

Уровень 9. Денежная система

капитал и оценка будущей ренты перераспределяются в сторону «второго контура» AI-инфры (interconnect/optics), а не только GPU

коммерческая рента LLM все больше зависит от *SLA/аптайма*, а значит - от финансируемого CapEx и контрактов на compute/сеть

формируется альтернативный центр капитализации и коммерциализации AI внутри китайского рынка (свой спрос, свои правила, свои каналы финансирования)

Уровень 8. Спонтанный порядок

доверие как институт «спонтанного порядка» начинает включать метрику *операционной надежности модели* (не только качество ответов)

«спонтанный порядок» китайского open-source/моделей как ответ на ограничения и конкуренцию - подтверждается обсуждением «что дальше у китайского open-source AI»

Уровень 7. Институты производства знаний

знание оформляется в виде доменных foundation models (микроструктура, трейд-ивенты) - это превращает ранее «ремесленную» экспертизу квантов в тиражируемый актив

происходит институционализация «локальных бенчмарков/локальной мультимодальности» (например, SEA-ориентированный omni-модельный стек)

акцент на «что реально» в сети (инициативы по проверке реальности/AI-контента) - попытка восстановить институты доверия

Уровень 6. Технологии производства знаний

исследовательская повестка «test-time compute scaling» и «adaptive routing» (ODAR) - это про экономию дефицитного ресурса кластера и сети, а не только про качество модели

фокус на cost-aware agentic systems и эффективности tool-use (HotelQuEST; ODAR; keyword-search agentic RAG)

модель-центричный подход дополняется симуляцией/сценариями/контрфактами (в т.ч

Уровень 5. Разделение труда между фирмами

Nvidia двигается к вертикализации всей AI-фабрики: GPU + interconnect + эталонные «системы»

конкуренция смещается от «чья модель умнее» к «кто держит нагрузку и даёт предсказуемую стоимость/задержку»

--- ## Сдвиг D

Уровень 4. «Железные» технологии

оптика становится частью «железного стандарта» для AI (пропускная способность/латентность/энергия)

JPMorgan: генеративный AI «трансформирует то, как работает кредитный рынок» и работу кредит-трейдеров из-за способности обрабатывать неструктурированные данные.,

На арXiv: foundation model для рыночной микроструктуры TradeFM

Уровень 3. Социально-профессиональная структура

Факт-ядро: крупная анти-AI акция в Лондоне у хаба King’s Cross, где офисы OpenAI/Meta/DeepMind

Уровень 2. Пространственная организация

Уровень 1. Природные ресурсы

--- ## Сдвиг B

Структурные сдвиги

AI-фабрика: от GPU-монополии к системной инфраструктурной войне (optics + interconnect + SLA)

От ‘модели’ к ‘агентной операционной системе’: tool-use, протоколы, бенчмарки эксплуатации

Финансы как ранний массовый потребитель agentic AI (credit/AML/microstructure FM)

Сигналы на радаре

Политизация AI в городских хабах

«Живые» бенчмарки безопасности

Снижение “обязательности” vector DB в RAG

Adaptive routing / Fast-Slow агенты

Физические угрозы датацентрам

Энергетическая/логистическая волатильность из-за Ирана

Моментум трендов

коммерческая рента LLM все больше зависит от SLA/аптайма, а значит - от финансируемого CapEx и контрактов на compute/сеть

доверие как институт «спонтанного порядка» начинает включать метрику операционной надежности модели (не только качество ответов)