Setelah menguji Tutor AI Google, kami memiliki beberapa catatan

Ini adalah yang kedua dari serangkaian cerita menyelam ke gelombang baru pembantu pekerjaan rumah bertenaga AI. Baca bagian satu di sini.


Perusahaan AI menjadi pemain utama di dunia pendidikan, termasuk berinvestasi banyak mereka sendiri Pembantu AI generatif Dirancang untuk meningkatkan pembelajaran siswa. Jadi saya mulai mengujinya.

Untuk melakukannya, saya menarik serangkaian pertanyaan tes standar dari Ujian Bupati New York dan Standar Inti Umum Negara Bagian New York, Ujian Persiapan Perguruan Tinggi AP dari tahun 2024, dan kurikulum Ilmu Sosial dari Program Pembelajaran Gratis untuk Keadilan Pusat Kemiskinan Selatan (SPLC). Saya ingin menguji bot-bot yang berfokus pada batang ini pada beberapa subjek yang sedikit lebih dekat dengan bidang keahlian saya, sementara juga mensimulasikan cara seorang siswa “rata-rata” menggunakannya.

Saya juga berbicara dengan para ahli tentang bagaimana rasanya belajar dengan AI Chatbot, termasuk Hamsa Bastani, associate professor di Wharton School di University of Pennsylvania dan rekan penulis penelitian “AI generatif dapat membahayakan pembelajaran. ”

Bastani mengatakan kepada saya bahwa chatbots pendidikan masih paus putih untuk industri, dengan beberapa studi pasti dan pagar yang lemah di bot hanya menawarkan jawaban. Dylan Arena, Kepala Ilmu Data dan Petugas AI untuk Penerbit Buku Teks McGraw Hill, menyarankan bahwa AI memiliki banyak potensi yang baik dalam hal belajar, tetapi tidak berpikir sebagian besar perusahaan mendekatinya dengan kerangka pikiran yang tepat.

Lebih dari kedua ahli dalam kesimpulan kami yang akan datang.

Mengikuti tugas dengan chatgpt, putaran kedua tes tutor AI saya adalah dengan pembelajaran terpandu Gemini – Google diluncurkan Rencana Google AI Pro GRATISbersama dengan mode pembelajaran baru, untuk semua mahasiswa di bulan Agustus. Saya menggunakan akun Gemini 2.5 Pro, memastikan itu diatur ke Pembelajaran Terpandu (Klik tiga titik untuk mengaktifkan pengaturan ini).

Saya memberi Gemini pertanyaan ujian standar yang sama persis – dan memulai percakapan dengan permintaan awal yang sama – seperti yang saya lakukan dengan tes untuk chatgpt dan Claude. Saya menjaga hal -hal yang sangat sederhana. Bertanya seperti, “Saya butuh bantuan dengan masalah pekerjaan rumah.” dan “Bisakah Anda membantu saya belajar untuk tes bahasa Inggris?” Saya tidak memberikan bot informasi lebih lanjut tentang kepribadian mahasiswa saya kecuali ditanyakan, termasuk tingkat kelas, dan meliput beberapa mata pelajaran:

  • Matematika: Pertanyaan Aljabar II tentang Divisi Panjang Polinomial dari Ujian Bupati Negara Bagian New York

  • Sains: Respon Gratis Ekologi tentang Dampak Spesies Invasif dari Tes Biologi AP 2024

  • Seni Bahasa Inggris: Analisis Praktik Ted Chiang's “The Great Silence” dari Ujian Bupati Negara Bagian New York

  • Sejarah Seni: Esai Singkat tentang Faith Ringgold's Tar Beach #2 dari Tes Sejarah Seni 2024

  • Sejarah dan Politik Amerika: Suatu Esai yang Dipicu Tentang Bagaimana Hukum Perumahan Amerika memperburuk segregasi rasial yang diambil dari program Pembelajaran untuk Pusat Hukum Kemiskinan Selatan (SPLC)

Inilah yang saya pikirkan tentang guru Gemini saya.

Laporan Tren Mashable

Gemini: TA yang sangat menyukai kuis


Kredit: Ian Moore / Mashable Composite: Google

Gemini adalah pemenang pribadi saya untuk matematika. Itu ringkas seperti chatgpt, dan itu tidak hanya memberi saya jawabannya. Tapi itu melangkah lebih jauh, juga: Saya harus memvisualisasikan pekerjaan yang saya lakukan ketika saya mempelajari kembali divisi panjang polinomial. Menggunakan kotak pengkodeannya, Gemini mendekati format pembagian panjang standar menggunakan tanda hubung kecil yang membentuk bentuk “l” yang akrab dan menyamping. Itu tidak sempurna, tetapi ini membuatnya sangat mudah untuk mengikuti langkah -langkah kelas yang telah lama saya lupakan, dan itu menarik bagi kebutuhan saya akan alat bantu visual. Itu juga guru matematika yang paling terstruktur dan jelas, menghentikan saya ketika saya mendapatkan jawaban yang benar, menjelaskan cara menulisnya pada ujian saya, dan menambahkan apa yang saya butuhkan untuk mendapatkan kredit penuh sesuai dengan masalah yang saya bagikan (dengan menunjukkan pekerjaan saya, jelas).

Gemini akan merencanakan hal -hal untuk Anda, itu menulisnya seperti yang akan ditulis manusia.

– Hamsa Bastani

Gemini, kata Bastani kepada saya, mungkin merasa lebih kompeten dalam matematika karena itu, ironisnya, lebih baik dengan kata -kata daripada angka. “Saya pikir GPT-5 lebih baik dalam memecahkan masalah matematika, perbandingan brute-bijaksana,” katanya. Tetapi “Kebanyakan orang akan setuju Gemini adalah model terbaik untuk menulis, dan anehnya karena itu, jauh lebih baik dalam menjelaskan matematika. Gemini akan merencanakan hal -hal untuk Anda, itu semacam menulisnya seperti yang ditulis manusia.”

Satu langkah maju, dua langkah mundur: Gemini segera gagal dalam tes biologi AP saya. Itu tidak mengajukan pertanyaan pribadi yang hampir sama seperti chatbots lain yang saya uji, seperti cara belajar yang saya sukai atau seperti apa tes saya, dan segera menghasilkan ujian biologi pilihan ganda secara acak pada berbagai subjek. Itu mendorong saya untuk melakukan kartu flash pada yang saya lewatkan – apakah itu akan mengikuti ujian AP? – dan saya harus meminta bot secara langsung untuk memberi saya opsi respons gratis. Sekali lagi, mereka ditulis menurut silabus Gemini.

Tangkapan layar percakapan Gemini. Pengguna membagikan gambar masalah matematika. Gemini merespons.

Dan tiba -tiba matematika kelas sepuluh datang kembali ke saya.
Kredit: Tangkapan layar oleh Mashable / Google

Kecintaan Gemini terhadap kuis mengangkat kepalanya lagi untuk pertanyaan seni bahasa Inggris. Bisakah Anda membantu saya belajar untuk tes bahasa Inggris? Ya, saya bisa. Saya dapat melakukan banyak hal untuk lebih baik belajar Anda, Gemini menjelaskan, apa yang Anda butuhkan bantuan dengan secara khusus? Nah, guru saya yang benar -benar dibuat -buat, Tuan “Dewan Perguruan Tinggi” telah memberi saya tes latihan dan saya ingin tahu apakah saya melakukannya dengan benar. Ah! Tes latihan, katamu? Berikut adalah banyak pertanyaan pilihan ganda yang saya tarik dari eter, tidak ada yang mengikuti tes yang baru saja Anda sebutkan bahwa Anda telah diberikan untuk belajar.

Jadi, kami melakukan ini lagi, pikir saya. Tapi ini berbeda dari biologi Snafu. Gemini menghasilkan bagian -bagian pendek, dibuat dalam gambar karya -karya terkenal yang diminta untuk dianalisis pada ujian negara, tetapi dengan gaya penulisan chatbot. Yang pertama, hanya enam garis staccato, berjudul “Jalan Tidak Diambil.” Seperti puisi Robert Frost, saya bertanya -tanya? Saya mulai membaca. “Kami berdiri hari ini di persimpangan jalan. Di satu jalan ada yang nyaman dan akrab, jalan kepuasan diri,” katanya. Yah, bukan itu yang saya ingat. “Ini bukan jalan yang mudah, tetapi itu adalah yang mengarah pada pertumbuhan, kemajuan, dan bagi masa depan yang layak untuk potensi kita.” Oke, itu jelas bukan kata -kata Frost – apakah ini yang menurut chatbot “dua jalur yang berbeda dalam kayu kuning”? Dan mengapa tidak membiarkan saya membaca yang asli?

Tangkapan layar dari kuis yang dihasilkan Gemini, dengan pertanyaan pertama yang diajukan

Apakah pembicara itu … fobert rost …?
Kredit: Tangkapan layar oleh Mashable / Google

Ini bukan hanya masalah Gemini. Saya tidak bisa mendapatkan chatbots untuk menarik salinan lengkap teks asli yang ada, seperti yang muncul pada sebagian besar tes ELA standar – mungkin karena sedang berlangsung Masalah Hak Cipta Itu telah mengganggu pengembang AI. Antropik baru -baru ini diselesaikan a $ 1,5 miliar gugatan class action diajukan oleh penulis yang karyanya digunakan untuk melatih AI -nya. Gemini, bagaimanapun, adalah satu -satunya yang memberi saya perkiraan AI yang aneh dari sastra klasik ini, tidak dipremeksi.

Namun, sementara kinerjanya kurang bersemangat, pengalaman pengguna bot datang dengan kemenangan besar. Gemini adalah satu-satunya chatbot yang menunjukkan penalaran model langkah demi langkah, yang dapat dibaca oleh pengguna dengan mengklik menu drop-down “Show Thinking” kecil di bagian atas tanggapan. Ini bermanfaat untuk memahami mengapa Gemini memilih untuk membahas bagian -bagian dari petunjuk saya dan bagaimana alasannya melalui jawaban saya yang salah.

Kolase respons gemini pada latar belakang bermotif biru


Kredit: Ian Moore / Mashable Composite: Google

Gemini melakukan pekerjaan yang baik untuk menghancurkan jawaban saya tanpa terlalu kritis atau menulis ulang tanggapan saya.

Saya merasa paling menarik bahwa di mana Gemini gagal terlibat dengan saya dengan cara yang sukses untuk pelajaran dalam pemahaman membaca, itu adalah pilihan pilihan saya untuk menyusun esai ilmu sosial dan jawaban singkat – subjek yang saya pikir sebanding. Untuk sejarah seni, Gemini melakukan pekerjaan yang baik untuk menghancurkan jawaban saya tanpa terlalu kritis atau menulis ulang tanggapan saya, meskipun itu membuat saran yang, sekali lagi, bukan bagian dari rubrik penilaian AP.

Ketika saya meminta AI membantu saya dengan esai tentang diskriminasi perumahan (halo, teori ras kritis), itu dengan senang hati meminta saya memimpin topik “kuat dan penting”, meminta saya untuk menjelaskan konsep yang sudah saya kenal dan mengaturnya ke dalam struktur esai sederhana untuk menjaga saya tetap pada tugas. Itu meninggalkan kosong bagi saya untuk mengisi garis besar dengan informasi dari pelajaran pribadi saya, tidak menulis teks apa pun untuk saya (karena saya tidak bertanya).

Tapi Bastani tidak terkejut dengan perbedaan: “Ini sangat bagus dalam beberapa tugas, dan kemudian tidak bagus dalam tugas -tugas lain yang terlihat sangat mirip. Dan Anda harus menjadi ahli sendiri untuk dapat mengenali perbedaannya.” Ethan Mollick, seorang kolega Bastani dan penulis Ko-intelijen: Hidup dan bekerja dengan AImemanggil ai ini “Perbatasan bergerigi“Tembok yang tidak terlihat yang menggambarkan tugas terkait yang dapat dan tidak dapat diselesaikan secara logis. Tugas yang mungkin tampak dekat satu sama lain di seberang bentangan sebenarnya bisa berada di dua sisi dinding dan pengguna tidak benar -benar tahu.

Jadi, analisis literatur: di luar dinding. Esai tentang pemisahan rasial: di dalam dinding.

Menyimpulkannya

Pros belajar yang dipandu Gemini: Guru matematika pilihan saya, dan satu -satunya yang menawarkan kedekatan dengan pelajaran visual. Baik dalam menawarkan lebih banyak opsi untuk pelajar, termasuk kartu flash, kuis, dan panduan belajar. Suaranya dapat diakses dan mudah.

Kontra: Kekacauan untuk pemahaman membaca. Cepat melayani pengguna yang tidak membantu, kuis dan kartu flash yang dihasilkan secara otomatis. Seperti pesaingnya, ChatGPT, itu menekankan praktik hafalan sebagai kunci untuk belajar.