Tribunjogja.com - Alibaba Cloud bekerja sama dengan MediaTek, perusahaan semikonduktor fabless global, untuk mendorong penggunaan AI di perangkat terbaru, dimulai dengan ponsel pintar.
Saat ini, versi large language model Qwen dengan parameter 1.8 miliar dan 4 miliar dapat dijalankan pada chipset premium generasi ketiga dari MediaTek, Dimensity 9300 dan Dimensity 8300, yang memungkinkan ponsel pintar untuk menjalankan tugas AI seperti menjawab beragam pertanyaan bahkan saat tidak terhubung ke internet atau memiliki koneksi yang terbatas.
AI generatif, yang sebelumnya hanya dapat diakses melalui pusat data, kini bisa hadir langsung di ponsel pintar.
Gartner memperkirakan bahwa hingga akhir 2024, akan ada 240 juta ponsel pintar dengan GenAI dan 54,5 juta PC dengan AI yang akan didistribusikan.
Kehadiran gawai ini akan mencakup 22 persen dari ponsel pintar kelas biasa, menengah, dan premium, serta 22 persen dari semua PC di tahun 2024.
"Kami melihat minat yang meningkat dari banyak perusahaan untuk menggunakan LLMs berukuran lebih kecil ke dalam gawai, untuk mendorong aplikasi AI generatif. Melalui kemitraan dengan MediaTek, kami ingin memberikan lebih banyak kesempatan kepada para pengembang untuk bisa menciptakan aplikasi AI yang inovatif dan mudah digunakan supaya pengguna di seluruh dunia bisa merasakan manfaat dari AI generatif," kata Xu Dong, Head of Business Development di Qwen team.
Baca juga: Alibaba Cloud Tingkatkan Dukungan untuk Indonesia dengan Inovasi AI Generatif Terbaru
Munculnya model-model yang Lebih Kecil
Peralihan dari cloud ke gawai didorong oleh munculnya LLMs yang lebih kecil yang biasanya berkisar dari beberapa juta hingga beberapa miliar.
Dibandingkan model sebelumnya yang lebih besar, model-model ini lebih efisien secara komputasi, lebih ekonomis, dan dapat disesuaikan dengan kebutuhan pengguna perangkat terbaru.
Alibaba Cloud telah menyediakan versi open source dari LLM dengan parameter 1,8 miliar, Qwen-1.8B, awal tahun lalu.
Karena memang dioptimalkan untuk perangkat yang lebih kecil, model ini membutuhkan daya komputasi yang lebih sedikit untuk dijalankan, sehingga memungkinkan aplikasi yang didukung oleh LLM berjalan di ponsel pintar dengan keterbatasan atau tanpa koneksi jaringan.
Untuk mengimplementasikan model AI di perangkat genggam, kompatibilitas merupakan tantangan utama, terutama karena perbedaan dalam perangkat keras, perangkat lunak, dan protokol komunikasi.
Alibaba Cloud mengatakan bahwa mereka bekerja sama dengan MediaTek dalam beberapa area untuk mengatasi tantangan integrasi ini, termasuk dalam optimasi ukuran model, optimasi inferensi, dan penyimpanan untuk mencapai keseimbangan antara akurasi model, efektivitas biaya, dan efisiensi energi.
Dengan dukungan dari Dimensity 9300, versi model Qwen dengan parameter 1,8 miliar bisa mencapai kinerja terdepan di industri dan sanggup menggunakan kurang dari 30 persen CPU dan 2 GB RAM dalam proses inferensi AI sambil mencapai lebih dari 20 token per detik.
Konsumsi daya dalam proses inferensi kurang dari 3 watt, memberikan peningkatan kinerja dalam tugas AI tanpa mengorbankan efisiensi energi.