Подходы к внедрению искусственного интеллекта на предприятии

Аннотация. Рынок предлагает изобилие решений на основе больших языковых моделей (LLM), однако большинство из них сводится к доступу к чужой модели и интерфейсу для написания инструкций (промптов). В статье обосновывается, что подлинная ценность ИИ для предприятия лежит не в доступе к модели, а в её адаптации к локальным знаниям организации, и что эта задача требует построения собственной инфраструктуры (RAG, агенты, локальное развёртывание), а не покупки доступа. Рассматривается, почему около 80 % офисных задач не поддаются тривиальной автоматизации, сравниваются методы адаптации моделей и формулируются условия «здорового» внедрения ИИ.

Ключевые слова: искусственный интеллект, большие языковые модели, RAG, ИИ-агенты, дообучение, локальные знания, корпоративная инфраструктура.

1. Введение: рынок изобилия и иллюзия простоты

За последнее десятилетие искусственный интеллект прошёл несколько отчётливых стадий. Глава NVIDIA Дженсен Хуанг на конференции GTC описывает эту траекторию как последовательность волн: ИИ восприятия (Perception AI), генеративный ИИ (Generative AI), агентный ИИ (Agentic AI) и, в перспективе, физический ИИ (Physical AI). Сегодня предприятия входят в агентную фазу, а вместе с ней — в эпоху изобилия предложений: десятки продуктов и консультантов обещают «внедрить ИИ» в сжатые сроки.

Однако если убрать маркетинговую оболочку, большинство этих предложений сводится к одному и тому же ядру: доступ к чужой модели (OpenAI, Google и др.) через API, обёрнутый в тонкий интерфейс для написания промптов. На профессиональном жаргоне такие продукты называют «обёртками над GPT» (GPT wrapper). По существу заказчику продают чужой интеллект за его же деньги, а «продукт» добавляет к нему экран входа и поле для ввода текста.

Само по себе это не бессмысленно — для части задач этого достаточно. Но здесь два изъяна. Во-первых, базовая возможность «написать инструкцию и получить ответ» доступна даже небольшим открытым моделям, развёртываемым самостоятельно, — платить за неё отдельно как за «платформу» нет необходимости. Во-вторых, и это опаснее, низкий порог создания такой обёртки притягивает псевдоэкспертов.

Хрестоматийный пример подмены — история BolgenOS (2010): школьник представил как «разработанную с нуля» операционную систему то, что на деле было модифицированной сборкой Ubuntu Linux с заменёнными обоями и переименованными программами. Проект стал символом поверхностного подхода к сложным техническим задачам — формы без содержания. В сфере ИИ этот паттерн воспроизводится буквально: переименованный вызов чужого API выдаётся за «корпоративную ИИ-платформу». Главный риск для лица, принимающего решение, — принять перекрашенный корпус за двигатель.

2. Что на самом деле умеют LLM: правило 20/80

Чтобы отличать содержание от обёртки, нужно трезво понимать сильные и слабые стороны самих моделей.

Современные LLM, построенные на архитектуре трансформера [3], действительно сильны в работе с языком: обработка и генерация текста на разных языках; резюмирование и извлечение информации; логическое, пошаговое рассуждение; программирование и формальные языки; интеграция с внешними инструментами. Это мощный, но узкий набор способностей.

При этом у моделей есть фундаментальные ограничения. Они не обладают реальным пониманием мира — они моделируют язык, а не действительность. Они склонны убедительно выдумывать несуществующие факты («галлюцинировать») [9]. Они не знают актуальных событий и ограничены данными обучения. И — что решающе для предприятия — они не знают вашу организацию: они никогда не видели ваши тарифы, вашу CRM, ваши регламенты, ваши заявки и неписаные договорённости сотрудников.

Отсюда практическое правило, многократно подтверждаемое на практике. «Из коробки» даже передовая модель способна закрыть лишь порядка 20 % повседневных задач сотрудника — ту их часть, что опирается на общие, энциклопедические знания: черновики и редактуру, генерацию идей, общие справочные запросы. Оставшиеся ~80 % завязаны на локальные знания: корпоративные данные, информационные системы и неявную компетенцию сотрудников.

Именно в этих 80 % сосредоточена и реальная экономическая ценность, и устойчивое конкурентное преимущество. Доступ к одной и той же модели может арендовать любой; но ничьи данные и процессы, кроме ваших, конкуренту недоступны. Это переворачивает логику «изобилия приложений»: сама модель — это товар широкого потребления (commodity), а трудная и ценная часть — связать её с вашими 80 %.

3. Почему «офисные» 80 % так трудно автоматизировать: парадоксы Поланьи и Моравека

Почему же эти 80 % не автоматизируются простой настройкой промптов? Ответ дают два классических результата.

Парадокс Поланьи (Майкл Поланьи, 1966) [1]: «Мы знаем больше, чем можем выразить словами». Значительная часть человеческой компетенции является неявной (tacit knowledge): мы умеем что-то делать, но не можем полностью сформулировать правила. Примеры — езда на велосипеде, распознавание лиц, способность почувствовать, что клиент действительно недоволен. В офисе опытный сотрудник «просто знает», как процесс работает на самом деле, какое отклонение допустимо и к кому обратиться. Это знание нигде не записано — а значит, его нельзя тривиально передать машине.

Парадокс Моравека (Ханс Моравек, 1980-е) [2]: задачи, которые кажутся человеку «сложными» — арифметика, шахматы, формальная логика, — для компьютера просты, тогда как «простые» для человека задачи — восприятие, моторика, социальное взаимодействие — оказываются для машин крайне трудными. Миллионы лет эволюции отточили наши сенсомоторные и социальные навыки; мы выполняем их без усилий и потому недооцениваем их сложность.

Вместе эти парадоксы объясняют асимметрию между двумя мирами, в которых работает предприятие.

Критерий	Мир для людей (офис)	Мир для машин (завод)
Единица работы	Документ, письмо, созвон, действие в контексте	Стандартизированная операция или деталь
Представление	PDF/Word, «как принято», устные договорённости	Датчики, форматы, точные допуски
Источник эффективности	Гибкость и неявные знания сотрудников	Жёсткая формализация
Отношение к ошибкам	Исправляются «на лету» человеком	Недопустимы — процесс собран в стандарты
Встраивание ИИ	Трудно: процесс нужно «перевести» в данные и API	Естественно: всё уже формализовано

Вывод принципиален: основная ценность корпоративного ИИ лежит именно в «мире для людей», и её освоение — не задача закупки, а задача инженерии и работы со знаниями: сделать неявные, неструктурированные знания организации «читаемыми» для машины.

4. Как адаптировать LLM к локальным знаниям: «модель» против «контекста»

Если модель не знает вашу организацию, есть две принципиальные стратегии. Одна изменяет саму модель; другая обогащает контекст, который модель видит в момент ответа.

Изменение модели. Простейший приём — обучение примерами в промпте (few-shot, in-context learning) [4]: в запрос помещаются образцы, и модель подстраивается под задачу без переобучения; это дёшево и мгновенно, но промпты нужно поддерживать в актуальном состоянии, и они расходуют контекст. Более глубокий путь — дообучение (Fine-tuning, в том числе LoRA [6]): модель дообучается на новых данных с изменением весов или добавлением компактных адаптеров. Дообучение хорошо усваивает стиль, формат и отраслевую лексику, но у него есть существенные минусы: знание «впечатывается» в веса и устаревает; обновление требует повторной подготовки данных и переобучения (ресурсоёмко); и — критично для предприятия — трудно проверить, почему модель ответила именно так, и есть риск «научить» её уверенно повторять устаревшие факты.

Обогащение контекста. Второй путь оставляет модель неизменной. RAG (Retrieval-Augmented Generation) [5]: в момент запроса система извлекает релевантные фрагменты из вашей собственной базы знаний и передаёт их модели как контекст. Механика доступна для понимания: документы разбиваются на фрагменты (chunks), переводятся в векторы (эмбеддинги — числовые представления, размещающие близкие по смыслу тексты рядом в многомерном пространстве; классическая иллюстрация: «король − мужчина + женщина ≈ королева») и хранятся в векторной базе; запрос также векторизуется, находятся ближайшие фрагменты, и модель формирует ответ, опираясь на них. Преимущества: знание остаётся внешним, а потому всегда актуально, проверяемо (видно, какой документ лёг в основу ответа) и обновляется правкой источника — без переобучения. Это прямо снижает галлюцинации, привязывая ответ к найденным свидетельствам.

Агенты (инструменты) идут ещё дальше: модели дают не только найденный текст, но и возможность действовать — вызывать API, выполнять запросы, искать в интернете, находить клиента в CRM. Обычная LLM лишь генерирует ответ в рамках одного диалога; агент способен инициировать действия. Базовая парадигма — ReAct [8], которая в цикле чередует рассуждение (reasoning, в духе chain-of-thought [7]) и действие (acting, вызов инструмента) — «подумал → сделал → наблюдаю → повторил» — до получения обоснованного ответа. На ReAct построены современные фреймворки (LangChain, LangGraph, LlamaIndex).

Рекомендация. Для большинства корпоративных задач, связанных со знаниями, RAG и агенты предпочтительнее дообучения. Дообучение сдвигает поведение модели, но «замораживает» знание, которое меняется еженедельно; RAG и агенты сохраняют стабильную модель и подключают её к живым данным и системам — актуально, проверяемо и дешевле в сопровождении. Дообучение оправдано в узких случаях: устойчивый стиль и формат, специализированная лексика, ограничения по задержкам или приватности. Практическое правило: меняйте контекст прежде, чем менять модель; обращайтесь к весам лишь тогда, когда контекст не справляется.

5. Открытый или локальный ИИ: безопасность, соответствие, надёжность

С выбором стратегии адаптации связан вопрос развёртывания. Открытый (внешний) ИИ — это обращение к чужой облачной модели. Локальный ИИ — это open-source-модели, развёрнутые внутри периметра компании на её собственных серверах.

Критерий	Открытый (внешний) ИИ	Локальный ИИ
Конфиденциальность данных	Внешние чужие серверы; риск утечки данных	Данные изолированы в периметре компании
Соответствие нормам	Риск нарушения законов о защите данных и крупных штрафов	Соответствие нормам; логирование запросов
Надёжность результатов	Галлюцинации; отсутствие проверки ответов	Обучение локальными знаниями; фильтрация ответа для точности

У локального подхода есть и обратная сторона. Плюсы: защита данных, интеграция в ИТ-системы, независимость от вендоров. Минусы: дорогая аппаратная часть и высокие требования к квалификации специалистов. Для предприятия, работающего с данными клиентов в регулируемой среде, эти издержки, как правило, оправданы выигрышем в конфиденциальности и соответствии нормам.

6. Что нужно для «здорового» внедрения ИИ: три опоры

Если принять, что цель — это 80 %, то связная программа внедрения опирается на три опоры.

Стек передовых технологий для работы ИИ. ИТ-инфраструктура (вычислительные мощности, сетевая инфраструктура, программная среда, MLOps-платформа); формализованные данные и описанные базы данных; передовые LLM-модели, развёрнутые внутри периметра компании. Без этого фундамента освоить локальные знания невозможно в принципе.
Вовлечение и развитие компетенций. Развивать собственных сотрудников, а не нанимать «звёзд»; давать сотрудникам открытый доступ к разным ИИ-инструментам (культура использования); устанавливать правила безопасного и этичного применения внешних и внутренних ИИ-ресурсов. Внедрение — это социальный процесс, а не установка программы.
Культура работы с неструктурированными знаниями. Самая трудная и чаще всего недооценённая опора. Необходимо сменить парадигму работы с документами — с принципа «всё, что мне нужно, лежит на моём рабочем столе» на общие, машиночитаемые знания. Нужны правила и методика распознавания, разметки и хранения знаний — цифровая библиотека, адаптированная под ИИ, — а также системы, дающие ИИ доступ к этой внутренней библиотеке. Это практический ответ на парадокс Поланьи: сделать неявное знание полностью явным нельзя, но систематически фиксировать его существенно больше, чем «как принято», — можно.

Практической иллюстрацией такого подхода служит внутренняя платформа уровня предприятия, построенная на open-source-решениях, локальных моделях и коннекторах к корпоративным системам с использованием RAG и агентов. Принципиально, что она не является аналогом или заменой ChatGPT, Gemini и других универсальных сервисов: её цель — помогать сотрудникам исполнять процессы и регламенты компании быстрее и точнее.

7. Заключение

Изобилие предложений на рынке ИИ создаёт иллюзию, будто внедрение равно покупке доступа. Но доступ к модели — это товар широкого потребления, а сама по себе модель закрывает лишь около 20 % задач. Ценность и устойчивость предприятия лежат в тех 80 %, что завязаны на его собственные данные, системы и неявные знания, — и эту часть нельзя купить в виде интерфейса поверх чужой модели. Её освоение требует реальной инфраструктуры, осознанного предпочтения RAG и агентов перед дообучением, локального развёртывания ради безопасности и соответствия нормам и — прежде всего — культуры, делающей знания организации читаемыми для машин. Выбор стоит не между тем, «какую обёртку купить», а между тем, покупать ли чужое решение или строить собственную компетенцию. BolgenOS — предостережение; подлинная инфраструктура знаний — цель.