tornando-se cada vez mais focado em cripto x robótica: - os robôs dependem de modelos de visão para interpretar e navegar em seu ambiente. - eles operam em um mundo complexo, multi-planar e tridimensional. - os modelos de visão requerem conjuntos de dados 3D únicos e do mundo real para permitir movimento físico e tomada de decisões. - ao contrário dos llms que podem ser treinados com toda a internet disponível, atualmente não há um "conjunto de dados do mundo real" estruturado disponível para iniciar novos treinamentos de modelos de visão. - a forte dependência de dados sintéticos neste espaço traz desvantagens significativas. - o "universo" de tarefas criadas pelo ser humano é efetivamente infinito, abrangendo incontáveis fluxos de trabalho, maneirismos humanos e nuances contextuais que precisam ser capturadas em conjuntos de dados treináveis. - mesmo depois que os dados do mundo real são capturados, estruturá-los e rotulá-los continua sendo altamente desafiador. a cripto pode fornecer incentivos em toda a pilha, desde a coleta de dados até a rotulagem, mobilizando contribuições humanas em larga escala e distribuídas.
4,26K