Андрей Карпатый поддерживает введение нового термина, связанного с «контекстной инженерией», в разработку программного обеспечения AI с использованием LLM. И этот термин долгое время казался очень нужным. Каждый раз, когда я объясняю людям, как мы разрабатываем наш Nethermind AuditAgent, одним из ключевых аспектов, помимо использования предметной экспертизы (web3 security) и использования лучших доступных моделей AI (от OpenAI, Anthropic и Google), а также инструментов для LLM, является именно «контекстная инженерия». Иногда встречается выражение «контекст — это король», и это действительно правда. LLM, будь то огромные продвинутые или оптимизированные маленькие LLM, являются мощным инструментом, но, как и любой инструмент, если он находится не в тех руках, вы получите гораздо менее многообещающие результаты, чем могли бы, если бы работали с ними правильно. И управление контекстом (или инженерия) — это действительно сложная и не очень хорошо описанная область, которая постоянно развивается, и она действительно возникла как расширение концепции оперативного инжиниринга, которая уже имеет некоторые негативные коннотации. В целом, Андрей перечислил основные аспекты, связанные с контекстной инженерией (на втором скриншоте), но в каждой конкретной задаче люди добиваются отличных результатов во многом путем проб и ошибок, каждый раз монотонно пытаясь подобрать правильные элементы контекста, которые действительно нужны на данном этапе решения задач, собирая бенчмарки для каждого этапа, смотря метрики, разделяя датасеты на тестовые, валидация и так далее, и тому подобное. Что вы думаете о «контекстной инженерии»?
Andrej Karpathy
Andrej Karpathy25 июн. 2025 г.
+1 за "контекстную инженерию" по сравнению с "быстрой инженерией". Люди ассоциируют подсказки с краткими описаниями задач, которые вы бы дали LLM при повседневном использовании. В каждом промышленном приложении LLM контекстная инженерия — это тонкое искусство и наука наполнения контекстного окна именно той информацией, которая нужна для следующего шага. Наука, потому что правильное выполнение этого процесса включает в себя описания и объяснения задач, несколько примеров, RAG, связанные (возможно, мультимодальные) данные, инструменты, состояние и историю, сжатие... Слишком мало или неправильная форма, и у LLM нет подходящего контекста для оптимальной производительности. Слишком много или слишком неуместно, и затраты на LLM могут возрасти, а производительность может снизиться. Сделать это хорошо очень нетривиально. А искусство из-за направляющей интуиции вокруг LLM, психологии людей, духов. Помимо самой контекстной инженерии, LLM-приложение должно: - Разбивайте проблемы на потоки управления - Правильно упаковывайте контекстные окна - Адресные звонки на LLM нужного типа и возможностей - обрабатывать потоки UIUX для генерации-верификации - многое другое - ограждения, безопасность, эвалы, параллелизм, предварительная выборка, ... Таким образом, контекстная инженерия — это всего лишь одна маленькая часть формирующегося толстого слоя нетривиального программного обеспечения, которое координирует отдельные LLM-звонки (и многое другое) в полноценные LLM-приложения. Термин «оболочка ChatGPT» надоел и очень, очень неправильный.
762