Todella mielenkiintoinen ajatus: LLM:t saavat monet kotitehtävät ja kokeet toimimaan huonosti. Entä jos voisimme käyttää LLM:iä suullisten kokeiden mittaamiseen?