Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Model lapisan ledakan open source akan segera hadir?
Izinkan saya membawakan Anda pengujian sebenarnya dari model Qwen-Image-Layered yang baru saja dirilis oleh Alibaba, yang merupakan model besar yang dapat membagi gambar menjadi lapisan yang berbeda, dan modelnya disesuaikan berdasarkan Qwen-Image.
Kali ini tes saya mencakup adegan khusus model (poster), uji kepatuhan instruksi (tentukan target ekstraksi), pemrosesan tepi (rambut), dan uji batas (semua stiker, satu stiker dapat mengekstrak lebih dari 50 lapisan).
Langsung ke kesimpulan, pertama-tama, modelnya terlalu besar, karena model ini didasarkan pada Qwen-Image, jadi ini adalah model 20B, saya menggunakan GPU HuggingFace Zero untuk menguji, masing-masing berjalan selama sekitar 2 menit, model memang dapat memisahkan lapisan, dan pemrosesan tepinya sangat bagus, tetapi stabilitasnya perlu dioptimalkan, dalam pengujian saya 4 lapisan dapat dikeluarkan, tetapi 8 atau 10 lapisan meledak, saya menduga itu mungkin telah melebihi batas waktu atau bug GPU Nol ( GPU adalah H200, tidak mungkin meledakkan memori video), ukuran outputnya hanya 544*736, pejabat juga merekomendasikan resolusi 640, ini juga perlu ditingkatkan, dan modelnya masih terlalu besar, 20B, saya berharap dapat mengoptimalkan ukuran berikutnya.
Teratas
Peringkat
Favorit
