Архив, у которого можно спросить.
Архив есть. Ответов из него — нет.
Если в отделе пять сотрудников тратят по 2 часа в день на поиск в документах, это 50 часов в неделю — фактически ставка одного человека в месяц уходит на Ctrl+F. Плюс пропущенные сроки, которые всплывают только при поступлении претензии.
Типовые сценарии:
«Нужен пункт о штрафных санкциях из договора 2022 года. Помню, что на 14-й странице, но их там 47». Полчаса листания, и ещё десять минут на проверку, что не пропустил поправку из допсоглашения.
Входящая корреспонденция за день — 80 документов. Каждый нужно открыть, понять, на кого расписать, занести в реестр. Половина дня уходит на то, что машина читает за десять минут.
«Бизнес хочет ChatGPT. Безопасность говорит: документы наружу не отдаём. Регулятор просит: покажите, где хранятся персональные данные». Между этими тремя сидеть — невозможно. Облачный сервис эту коллизию не решает.
«Покажите журнал: кто, когда, что открывал». А журнала, который собирается автоматически и не редактируется, — нет. Перед каждой проверкой сводят руками из логов трёх систем. Один пропуск — штраф.
Один и тот же отдел. Две разные недели.
- Поиск пункта договора — 30 минут листания.
- Поиск по смыслу невозможен, только Ctrl+F.
- Один ответ юриста — 2 часа поиска плюс час проверки.
- Сканы и фотографии документов в поиске не участвуют.
- Журнал действий собирают вручную перед каждой проверкой.
- Внешние LLM-сервисы — документы наружу отправлять нельзя.
- Вопрос на естественном языке — ответ за несколько секунд.
- Поиск по смыслу и по точному слову — в одной строке.
- Юрист открывает абзац-источник одним кликом и сверяет ответ.
- Сканы, фото и многостраничные PDF — в одном поиске.
- Журнал действий пишется автоматически и не редактируется.
- Модель работает на вашем сервере, документы остаются внутри.
У каждой роли в ведомстве — свой день, который становится короче.
ARA меняет рабочий день нескольких конкретных ролей в ведомстве. Вот что получает каждая из них.
Найти пункт за 5 секунд, а не за 30 минут
Спрашиваете нормальным языком: «штрафные санкции в договоре с Acme». ARA возвращает абзац и ссылку на страницу-источник. Не надо доверять модели «на слово» — оригинал открывается одним кликом для проверки.
- Цитата с адресом: документ №, страница, абзац.
- Допсоглашения и поправки увязаны с основным контрактом.
- Поиск работает на узбекском, русском и английском одинаково.
80 входящих в день — и ни одного потерянного
Каждый поступивший документ автоматически прочитан: тип определён, имена и даты вытащены, занесён в реестр. Остаётся принять решение «кому расписать» — не вычитывать с нуля. Полдня вашего времени возвращается обратно.
- Автоматическая классификация: контракт, приказ, обращение.
- Реквизиты в карточку: №, дата, отправитель, сроки.
- Сканы из факса и фото с телефона — без отдельного «привести в вид».
Закрытый контур, открытый стек, без подписки
Между «бизнес просит AI» и «безопасность запрещает облако» появляется третий вариант. Свой сервер, своя модель, открытые компоненты. Никакого ежемесячного счёта за токены. Бюджет считается один раз.
- Развёртывание в вашем ЦОДе, не в чужом облаке.
- Open-source стек: Postgres, RabbitMQ, Qdrant, vLLM, Qwen.
- Код и данные остаются у вас и могут быть перенесены.
Журнал, который проходит проверку с первого раза
Каждое действие — загрузка, открытие, запрос — пишется в аудит-журнал с идентификатором пользователя, временем и контекстом. Не редактируется задним числом. Выгружается одним кликом для регулятора.
- Кто, что, когда, с какого IP — append-only журнал.
- Каждый ответ LLM привязан к source-фрагменту: проверяемо.
- Печатная форма журнала — для проверки в один клик.
От папки со сканами — до ответа на вопрос
пять шагов · меньше минуты на типовой документВосемь компонентов в одном пилоте.
Собранный стек: OCR, эмбеддинги, векторный поиск, дообученная модель, аудит-журнал. Один контракт, одна команда внедрения, одна точка ответственности.
Получить полный список-
Распознавание текста (uz · ru · en)Сканы, фотографии и многостраничные PDF — в одном пайплайне.
-
Извлечение полей в JSONИмена, суммы, даты, сроки — по заданной схеме.
-
Семантический поиск и точное совпадениеОдна строка ищет по смыслу и по точному слову.
-
Вопросы по корпусу со ссылкойКаждый ответ снабжён ссылкой на абзац-источник для проверки.
-
Дообучаемая LLM под ваш доменQwen2.5 + LoRA/QLoRA для адаптации модели к вашим документам.
-
Аудит-журнал, готовый к проверкеКто загрузил, кто открыл, кто спросил. Append-only, печатается одним кликом.
-
Развёртывание на вашем сервереPostgres, RabbitMQ, Qdrant, vLLM — всё локально.
-
Открытый стекОткрытые компоненты, перенос на другую инфраструктуру возможен.
Без облака. Без подписки. На вашем сервере.
Пилот разворачивается на вашей инфраструктуре. Документы не покидают периметр. Если решение не подходит — оно снимается с сервера без обязательств.
Открытые компоненты промышленного уровня
Postgres — источник истины. RabbitMQ — очередь для тяжёлых задач. Qdrant — векторный поиск. vLLM — инференс LLM. Все компоненты заменяемы.
Пилот на вашем сервере, на ваших документах.
Разворачиваем пилот на вашей инфраструктуре, показываем работу на вашем корпусе документов. Связаться напрямую можно через Telegram или email.
- Развёртывание на вашем сервере, документы остаются внутри.
- Фиксированная стоимость пилота, без подписки.
- Если решение не подходит — оно снимается с сервера без обязательств.
Ответ в течение дня.