Suara adalah salah satu cara paling berguna untuk berinteraksi dengan AI untuk melakukan pekerjaan tetapi tampaknya telah setengah ditinggalkan untuk penggunaan serius di luar kasus "mengobrol dengan teman". Semua mode suara hanya mengakses model lemah dengan latensi rendah, membuatnya cepat & menyenangkan tetapi agak tidak berguna.
Jika Anda tidak menganggap model suara sebagai obrolan yang menyenangkan, melainkan sebagai cara kerja, itu menunjukkan bahwa jeda baik-baik saja, bahkan lebih disukai (jangan bicara dengan saya kecuali Anda memiliki sesuatu untuk dikatakan). Dan UX alternatif di luar "berbicara dengan AI Anda tentang cuaca" menjadi mungkin untuk dijelajahi.
Juga saya ingin mematikan pernapasan, cekikikan, dan kebingungan. Antropomorfisme dapat membantu dalam banyak kasus, tetapi terlalu banyak, terutama untuk diskusi serius. Nadanya mati dan terasa menyenangkan dan memperlambat segalanya.
Ketika Mode Suara Lanjutan keluar, saya pikir berbicara dengan AI akan menjadi cara utama di mana orang bekerja dengan AI, mengingat kemudahan dan kecepatan diskusi versus mengetik. Tapi sepertinya suara terjebak dalam jalan buntu obrolan yang menyenangkan tanpa eksplorasi pendekatan yang lebih baik.
43,07K