Den öppna källkodsmodellen med exploderade lager kommer så snart? Låt mig ge dig det faktiska testet av Qwen-Image-Layered-modellen som just släppts av Alibaba, som är en stor modell som kan dela upp bilder i olika lager, och modellen är finjusterad baserat på Qwen-Image. Den här gången täcker mitt test modellens specialscener (poster), instruktionsefterlevnadstest (ange extraktionsmålet), kantbearbetning (hår) och gränstest (alla klistermärken, ett klistermärke kan extrahera mer än 50 lager). Direkt till slutsatsen, först och främst är modellen för stor, eftersom denna modell är baserad på Qwen-Image, så det är en 20B-modell, jag använde HuggingFace Zero GPU för att testa, varje körning i ungefär 2 minuter, modellen kan faktiskt separera lager, och kantbearbetningen är mycket bra, men stabiliteten måste optimeras, i mitt test kan 4 lager exporteras, men 8 eller 10 lager exploderade, jag misstänker att det kan ha överskridit Zero GPU-timeout eller bugg ( GPU:n är H200, osannolikt att videominnet exploderar), utgångsstorleken är bara 544*736, tjänstemannen rekommenderar också 640 upplösning, detta behöver också förbättras, och modellen är fortfarande för stor, 20B, jag hoppas kunna optimera nästa storlek.