The Verifier Alliance dataset now has 8M+ verified contracts! @ethereum has a strong verification culture, but data is siloed and hard to access. We’ve opened it all up in Parquet format for researchers, analysts, and AI engineers. Explore the schema & download the dataset👇
@SourcifyEth @blockscout @routescan_io Para que serve esse conjunto de dados? - Teste do compilador - Identificação de padrões de vulnerabilidade em contratos - Modelos de treinamento - Análise de dados de contratos de EVM ... muitos outros casos de uso que não eram possíveis sem um conjunto de dados aberto Reunidos por @blockscout @routescan_io @SourcifyEth
Como são os dados? VerA é um banco de dados PostgreSQL com cada verificação sendo um acoplamento entre uma "implantação" e uma "compilação". Os bytecodes e fontes são desduplicados em tabelas separadas. Veja o esquema:
O bytecode EVM não é estruturado. Portanto, "transformações" marcam as alterações nos valores de dados necessárias para alcançar um bytecode onchain a partir de um bytecode recompilado. Isso inclui imutáveis, bibliotecas, cborAuxdata, constructorArguments, posições e valores
Todo o banco de dados é exportado diariamente em Parquet, um formato de dados moderno baseado em colunas que pode ser consultado diretamente. Vá até os documentos e veja como fazer o download:
81,22K