Ide yang sangat menarik: LLM membuat banyak jenis pekerjaan rumah dan ujian tidak lagi bekerja dengan baik. Bagaimana jika kita bisa menggunakan LLM untuk menskalakan ujian lisan?