Brain in a Jar
[МОЗГ В БАНКЕ] Или RAG с нуля за одну сессию и PDF-мануал на 3500 страниц, пересказанный по-русски.
Я два месяца не вылезаю из-за компа и у меня трясутся руки от количества кофе, но сегодня я натурально орал на весь дом, потому что мой агент, который живёт внутри моего же приложения, сам полез в базу знаний по DaVinci Resolve, нашёл конкретную главу про цветокоррекцию из мануала на 3500 страниц, и пересказал мне по-русски, хотя мануал на английском, а я по-английски могу только fuck you сказать нахуй.
Как это вообще
Я не программист, если что, я этого никогда не скрывал, и каждый раз когда я это говорю мне никто не верит, потому что у меня десктопное приложение на Rust и React, которое я собрал руками Claude Code за два месяца, и вот сегодня я к нему прикрутил RAG, систему баз знаний, с нуля, за одну сессию, девять с лишним тысяч строк кода, и оно работает, блин, оно реально работает.
Не «работает в теории». Не «компилируется и показывает пустую страницу». Я скормил ему PDF-мануал DaVinci Resolve на 25 тысяч чанков, статью с сайта, субтитры с YouTube-видео, и когда я спросил агента «расскажи что в видео рассказывают», он сам вызвал инструмент поиска, сам сформулировал запрос на английском, сам выбрал нужный источник из трёх, и выдал мне структурированный ответ по-русски. Без единой моей подсказки куда смотреть.
Команда
Я запустил четырёх агентов. Два кодера, два ревьюера. Один кодер пилил Rust-бэкенд, второй React-фронтенд, каждый в своей git-ветке чтобы не наступали друг другу на ноги. Ревьюеры проверяли код и находили реальные баги, я не знаю, SQL-инъекция в LanceDB, SSRF-уязвимость в скрейпере, race condition в temp-директории для YouTube, несовпадение типов между фронтом и бэком на пяти разных структурах данных.
Самое безумное в этом то как оно итерируется, потому что я сижу в кресле с чашкой кофе, говорю «ну вот эта оранжевая хуйня внизу сайдбара, уберите нахуй», и через три минуты кодер коммитит, ревьюер проверяет, я вижу результат, и мы переходим к следующему. Я за день прошёл путь от «а давайте подумаем какой фреймворк для RAG взять» до полностью рабочего MCP-сервера с четырьмя инструментами, настройками, карточкой в дашборде, поддержкой PDF через poppler, EPUB, веб-скрейпинга и YouTube.
Модель в бинарнике
Внутри приложения живёт маленькая нейросеть размером 23 мегабайта, которая превращает текст в набор чисел, «вектор», и похожие по смыслу тексты дают похожие векторы. Она скачивается один раз при первом использовании, дальше работает локально, без интернета, без облака, без подписок, прямо в Rust через ONNX Runtime. Когда я это осознал, у меня случился короткий экзистенциальный кризис, потому что я вообще не знал что такое эмбеддинги три часа назад, а теперь у меня в приложении встроенная нейросеть и я обсуждаю с архитектором стоит ли перейти на мультиязычную модель bge-m3 для лучшего качества поиска по русскоязычным запросам.
Убитые дети
Знаете что мне больше всего нравится в этом процессе, я начал с того что нарисовал систему с привязкой баз знаний к чатам, с аккордеоном в сайдбаре, с автоматической подстановкой контекста, написал полторы тысячи строк кода, протестировал, и всё удалил нахуй. Потому что когда у агента появился MCP-инструмент для поиска, вся эта ручная линковка стала бесполезной, он сам умнее ищет чем любая автоматика. Минус 341 строка одним коммитом, и приложение стало лучше. Я убил своих детей и ни разу не пожалел.
Грусть
— тут личное, можно пролистать
Я нигде в интернете не видел чтобы кто-то работал с Claude Code так, через мультиагентную команду где архитектор координирует кодеров и ревьюеров, где агенты держат роли на протяжении всей сессии, где можно запустить хоть двадцать параллельных процессов если железо вывезет. Я вижу как люди используют один чат, одну сессию, «напиши мне функцию», и это как смотреть на человека который купил болид Формулы-1 и ездит на нём за хлебом на первой передаче.
И никто про это не знает, потому что мне неинтересен маркетинг, мне интереснее сидеть и ковыряться. Второй месяц за компом, не вылезая. Потому что по кайфу.
Цифры
Если кому интересно, итого за сессию: 34 файла, +9250 строк, 15 Rust-модулей (парсеры PDF/EPUB/web/YouTube, векторный индекс на LanceDB, эмбеддинги через fastembed, MCP-сервер с 4 инструментами, система настроек), 13 React-компонентов (управление базами, поиск, карточка в дашборде, секция в настройках). Два полных аудита с двумя раундами исправлений. Один сломанный PDF-парсер, одна SQL-инъекция, одна SSRF-дыра, всё пофиксили до мёрджа. Ни одного конфликта при слиянии.
Мой агент сейчас умеет искать по моим книгам, статьям и видео, и отвечать мне на человеческом языке. Я не программист. У меня есть база по режиссуре на несколько тысяч страниц. Завтра я её скормлю.