Sejak 20 Januari kemarin, komunitas AI global dikejutkan oleh berita tentang DeepSeek, sebuah laboratorium penelitian China yang sebelumnya kurang dikenal, merilis model open-source yang revolusioner. Beberapa media internasional Amerika Serikat (AS) seperti CNBC bahkan menulis dalam paragraf awal dengan kalimat superlatif.
“A little-known AI lab out of China has ignited panic throughout Silicon Valley after releasing AI models that can outperform America’s best despite being built more cheaply and with less-powerful chips.“
Model yang dirilis secara terbuka tersebut, bernama DeepSeek-R1, mereka mengklaim berhasil mengungguli model-model AI terkemuka dari Barat dalam berbagai benchmark matematika dan penalaran. Kondisi ini, oleh beberapa pakar AI dianggap bukan sekadar peningkatan kecil—ini adalah perubahan besar dalam lanskap AI. Keunggulan yang dinilai oleh banyak pakar AI dikaitkan dengan perbandingan kemampuan pemecahan kompleksitas masalah, efisiensi biaya, hingga keterbukaan bagi para pengembangan. Pendeknya, DeepSeek memaksa para pemimpin teknologi di Silicon Valley untuk memperhatikan.
Kisah DeepSeek sama menariknya dengan pencapaiannya. Kebangkitannya mencerminkan tren yang lebih luas dalam inovasi teknologi China, yang berkembang berkat keterbatasan dan kecerdikan, bukan hanya skala besar. Di balik kesuksesan ini terdapat visi Liang Wenfeng, pendiri Quantitative Hedge Fund yang beralih menjadi pelopor AI, yang berani bermimpi besar di lingkungan yang kompetitif dan penuh batasan.
Dari Keuangan ke Kecerdasan Buatan
DeepSeek tidak bermula sebagai startup AI tradisional. Awalnya, perusahaan ini adalah Fire-Flyer, cabang penelitian deep learning dari High-Flyer, salah satu Quantitatif Hedge Fund paling sukses di China. Didirikan pada 2015, High-Flyer mengumpulkan miliaran dengan memanfaatkan komputasi canggih untuk menganalisis data keuangan. Pada 2023, Liang Wenfeng, otak di balik High-Flyer, memutuskan untuk beralih haluan. Dengan gelar master dalam ilmu komputer dan passion mendalam terhadap kecerdasan buatan, ia mengubah Fire-Flyer menjadi DeepSeek, dengan tujuan ambisius untuk mengembangkan kecerdasan umum buatan (AGI).
Keputusan ini, menurut Liang, tidak didorong oleh motif komersial. “Riset ilmu dasar memiliki ROI yang sangat rendah” katanya kepada media China 36Kr.
DeepSeek mengambil jalan yang berbeda dari rekan-rekannya. Sementara kebanyakan perusahaan AI China bergantung pada pendanaan dari raksasa teknologi seperti Alibaba atau Baidu, DeepSeek memilih untuk tetap independen. Liang percaya bahwa kebebasan dari tekanan korporat akan memungkinkan timnya fokus pada penyelesaian masalah-masalah tersulit dalam AI, meskipun tidak langsung menghasilkan keuntungan.
Tim Muda yang Ambisius
Salah satu strategi unik DeepSeek adalah pendekatannya terhadap talenta. Liang membentuk tim yang terdiri dari lulusan baru dari universitas-elite China seperti Tsinghua dan Peking. Banyak dari peneliti ini memiliki rekam jejak akademis yang gemilang, termasuk publikasi di jurnal-jurnal terkemuka dan penghargaan dari konferensi internasional. Namun, mereka kurang memiliki pengalaman industri yang biasanya menjadi prioritas perusahaan.
“Tim teknis inti kami terdiri dari orang-orang yang lulus dalam satu atau dua tahun terakhir,” jelas Liang dalam satu artikel tahun 2023 di 36Kr.
Strategi rekrutmen yang tidak biasa ini menciptakan budaya kolaboratif di mana para pemuda bisa mengambil risiko dan mengejar ide-ide yang tidak konvensional. Dengan sumber daya komputasi yang melimpah, para peneliti ini bebas bereksperimen dan berinovasi.
Kebangkitan DeepSeek erat kaitannya dengan realitas geopolitik perang teknologi dingin antara AS dan China. Pada Oktober 2022, AS memberlakukan kontrol ekspor yang membatasi akses perusahaan China ke chip canggih seperti Nvidia H100. DeepSeek, yang awalnya memiliki stok 10.000 GPU, harus berinovasi untuk mengatasi pembatasan ini.
Alih-alih mengeluh tentang kurangnya hardware, tim DeepSeek fokus pada optimalisasi software. Dengan menggabungkan teknik-teknik seperti Multi-head Latent Attention (MLA) dan Mixture-of-Experts dengan solusi rekayasa baru, DeepSeek mencapai efisiensi yang belum pernah terjadi sebelumnya. Model terbaru mereka, menurut penelitian Epoch AI, hanya membutuhkan sepersepuluh daya komputasi yang digunakan untuk melatih Meta Llama 3.1. Efisiensi ini tidak hanya menetapkan standar baru dalam pengembangan AI, tetapi juga menantang efektivitas kontrol ekspor AS.
Model terbaru mereka, menurut penelitian Epoch AI, hanya membutuhkan sepersepuluh daya komputasi yang digunakan untuk melatih Meta Llama 3.1. Efisiensi ini tidak hanya menetapkan standar baru dalam pengembangan AI, tetapi juga menantang efektivitas kontrol ekspor AS.
DeepSeek menekankan bagaimana metode inovatif dapat menginspirasi pendekatan serupa yang mengoptimalkan sumber daya secara global. Mereka telah menunjukkan bahwa model AI canggih dapat dibangun dengan sumber daya yang jauh lebih sedikit, membuka ruang untuk optimalisasi dalam norma pengembangan AI saat ini.
Mengadopsi Filosofi Open Source
Mungkin aspek paling mengejutkan dari kesuksesan DeepSeek adalah filosofi open-source-nya. Dengan merilis DeepSeek-R1 ke publik, perusahaan ini membangun ‘goodwill’ dan kolaborasi dalam komunitas AI global. Di industri yang sering dikritik karena ketertutupannya, keterbukaan DeepSeek menjadi hal yang mencolok.
Bagi Liang, strategi ini sejalan dengan keyakinannya pada kekuatan kolektif inovasi. Membuka sumber model memungkinkan peneliti dan pengembang di seluruh dunia untuk berkontribusi, menyempurnakan, dan mengembangkan terobosan DeepSeek. Pendekatan ini tidak hanya mempercepat kemajuan teknologi, tetapi juga mendemokratisasi akses ke alat-alat AI terkini.
Implikasi dari hal ini sangat luas. Kebijakan AS yang dirancang untuk membatasi akses China ke hardware AI canggih mungkin perlu dievaluasi kembali. Perkiraan yang ada tentang kemampuan AI China bisa berubah drastis. Terobosan efisiensi DeepSeek dapat menginspirasi gelombang inovasi baru, memaksa perusahaan-perusahaan Barat untuk memikirkan kembali strategi mereka. Apakah ini menandai awal era baru untuk AI China atau pergeseran yang lebih luas dalam ekosistem AI global, satu hal yang pasti: DeepSeek telah muncul, dan ia akan menantang dominasi Barat dalam perlombaan AI.
