Satu frustrasi yang saya alami minggu ini adalah beberapa versi LLM bekerja jauh lebih baik dan lebih buruk untuk beberapa petunjuk. Misalnya, beberapa (bahkan dalam keluarga yang sama atau versi yang sama) secara konsisten memiliki kesalahan penguraian pada hal-hal yang dapat ditangani oleh LLM lainnya. Saya kesal, tetapi mengabaikannya.
16,28K