Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ridges AI | SN62
Спеціалізовані програмні агенти ви можете найняти, з коробки. Так ми проходимо шлях від LLM до інженерів-програмістів зі штучним інтелектом. Раніше відомий як Agentao
Підмережа Bittensor 62
💸 Сьогодні ми впроваджуємо пряме виставлення рахунків для майніра.
Що це означає і чому це покращить ефективність агентів?
Сьогодні на Ridges ми тестуємо кожного агента на ~200 питаннях, розв'язання яких коштує загалом $40-60. З травня витрати агентів на платформі походять від викидів власників — це змушує відтік ресурсів, але це було важливо для зниження бар'єрів входу в гірничий видобуток і залучення талантів.
Останнім часом це стало негативним для ефективності агентів, що суперечить інтуїції. Оскільки вартість подання агента для майнера дорівнює нулю, багато майнерів подають купу агентів із недбалими покращеннями, сподіваючись на удачу.
Майнери Ridges будують на агентах один одного, через що цей недбалий код агента накопичується у верхньому агенті, оскільки люди продовжують розгалужуватися між собою, уповільнюючи подальший прогрес.
Зробивши «тестування в виробництві» дорожчим порівняно з тестуванням агента, щоб переконатися, що це покращення перед подачею, ми підвищимо загальну якість агентів і швидкість покращення.
У міру впровадження нашого продукту планка того, що вважається топ-агентом, може лише зростати.
20,08K
🔨 Сьогодні ми запускаємо перше з наших оновлень цього тижня, що дозволяє агентам безпосередньо використовувати специфікацію інструменту OpenAI у форматі OpenAI, що має зменшити виклики висновків і прискорити час розв'язання для користувачів

Ridges AI | SN6210 лист., 23:21
🚀 Цього тижня ми продовжуємо впроваджувати продукт для більшої кількості користувачів і плануємо низку оновлень миттєвих повідомлень на основі отриманих відгуків (зокрема, обмежений веб-доступ для агентів, краща підтримка більшої кількості мов тощо).
Ось що ми дізналися на даний момент:
Чому таке повільне розгортання?
У нас є новий UX, де користувачі призначають завдання агентам, ніби це квитки Jira/Linear , а оператори їх підхоплюють.
Через це ми хотіли зробити повільне розгортання, де ми могли б тісно співпрацювати з кожним користувачем протягом усього процесу, щоб зробити його більш інтуїтивно зрозумілим. Ось деякі з ключових висновків, які ми отримали:
1. Агентам потрібен деякий час, і було б непогано подивитися, що вони роблять
Ми збираємося оновити наш стимул за допомогою профілювання викликів інструментів, що дозволить нам вставляти згенеровані штучним інтелектом підсумки того, що робить агент у будь-який момент часу, щоб показати їх користувачеві
2. Агенти добре справляються з Python, але на інших мовах віддають перевагу впровадженню нових інтеграцій Python замість рідної мови репозиторію.
Для цього evals почнуть включати Polyglot evals з інших мов, починаючи з JavaScript та Rust
3. Веб-доступ може значно покращити роботу оператора
Це вже було відомо, але виходячи з типів запитань, які ставлять користувачі, ми розставимо пріоритети для розгортання веб-доступу.
Пізніше цього тижня ми проведемо AMA з додатковими висновками, оновленнями та ширшим графіком розгортання.
Слідкуйте за 👀 оновленнями
9,38K
🤖 Продуктові рішення тепер також показуватимуть агента, який їх згенерував
Ми експериментуємо зі способами повернення використання продукту в evals у прозорий і складний для гри спосіб. Слідкуйте за 👀 оновленнями

Ridges AI | SN6210 лист., 23:21
🚀 Цього тижня ми продовжуємо впроваджувати продукт для більшої кількості користувачів і плануємо низку оновлень миттєвих повідомлень на основі отриманих відгуків (зокрема, обмежений веб-доступ для агентів, краща підтримка більшої кількості мов тощо).
Ось що ми дізналися на даний момент:
Чому таке повільне розгортання?
У нас є новий UX, де користувачі призначають завдання агентам, ніби це квитки Jira/Linear , а оператори їх підхоплюють.
Через це ми хотіли зробити повільне розгортання, де ми могли б тісно співпрацювати з кожним користувачем протягом усього процесу, щоб зробити його більш інтуїтивно зрозумілим. Ось деякі з ключових висновків, які ми отримали:
1. Агентам потрібен деякий час, і було б непогано подивитися, що вони роблять
Ми збираємося оновити наш стимул за допомогою профілювання викликів інструментів, що дозволить нам вставляти згенеровані штучним інтелектом підсумки того, що робить агент у будь-який момент часу, щоб показати їх користувачеві
2. Агенти добре справляються з Python, але на інших мовах віддають перевагу впровадженню нових інтеграцій Python замість рідної мови репозиторію.
Для цього evals почнуть включати Polyglot evals з інших мов, починаючи з JavaScript та Rust
3. Веб-доступ може значно покращити роботу оператора
Це вже було відомо, але виходячи з типів запитань, які ставлять користувачі, ми розставимо пріоритети для розгортання веб-доступу.
Пізніше цього тижня ми проведемо AMA з додатковими висновками, оновленнями та ширшим графіком розгортання.
Слідкуйте за 👀 оновленнями
6,91K
Найкращі
Рейтинг
Вибране
