Pada zaman kecerdasan buatan, kami telah lama menumpukan pada kuasa pengkomputeran, kapasiti dan kelajuan.Kami menambah lebih banyak DRAM, menyusun HBM dan mengembangkan NAND 3D untuk menyokong model yang lebih besar dan inferens yang lebih pantas.Tetapi krisis senyap dan berbahaya sedang muncul: data tidak lagi boleh disimpan dengan pasti.
Apabila AI berkembang daripada AI generatif kepada AI Agentik autonomi, sistem memerlukan keadaan yang berterusan, ingatan jangka panjang dan membuat keputusan yang berterusan.Mereka tidak lagi boleh bertolak ansur dengan data sementara atau tidak stabil.Pada masa yang sama, penskalaan DRAM dan NAND tanpa henti untuk mencapai ketumpatan yang lebih tinggi secara serius menghakis pengekalan data dan margin ralat.
Cabaran teras storan telah beralih: daripada "bolehkah kita menyimpannya?"kepada "bolehkah kita menyimpannya dengan betul?"
Aliran Teras: AI Menjadikan Kebolehpercayaan Storan Kritikal
Sistem AI bukan lagi tugas pengkomputeran sekali sahaja.AI Agentik Moden bergantung pada:
- Ingatan jangka panjang
- Keadaan sistem yang mampan
- Autonomi, membuat keputusan berterusan
Ini bermakna storan mesti dikekalkan data yang tepat dari semasa ke semasa, bukan hanya bekerja untuk tempoh yang singkat.Kebolehpercayaan telah menjadi faktor penentu untuk kestabilan infrastruktur AI.
Punca Punca: Penskalaan Mengurangkan Kebolehpercayaan
Penambahbaikan ketumpatan secara langsung merosakkan kestabilan.Ini adalah pertukaran yang tidak dapat dielakkan.
Untuk NAND Flash
- Mengecilkan dimensi XY
- Peningkatan lapisan susun 3D
- Keputusan: margin ralat yang lebih rendah, kehilangan caj yang lebih mudah
Untuk DRAM
- Peralihan kepada DRAM 3D
- Saiz sel lebih kecil
- Keputusan: masa pengekalan yang lebih pendek, toleransi bunyi yang lebih rendah
Peraturan: Ketumpatan lebih tinggi = Kebolehpercayaan yang lebih rendah
Masalah Penting NAND: Kehilangan Caj
Kegagalan NAND berpunca daripada kehilangan caj, yang berlaku dalam dua cara utama:
- Kebocoran cas menegak – cas terlepas ke dalam saluran
- Resapan cas sisi – sebaran cas antara baris perkataan
Kegagalan Pengekalan Jangka Pendek vs Jangka Panjang
- Jangka pendek: Perangkap cetek, anjakan voltan awal (IVS), perubahan muncul dengan cepat
- Jangka panjang: Perangkap dalam, mekanisme gabungan (TAT / DT / TE), isu menjadi lebih kompleks dari semasa ke semasa
Kelemahan Tersembunyi DRAM: Ia Tidak Boleh "Memegang" Data Sama ada
DRAM tidak selamat daripada kegagalan pengekalan.Ia mengalami pelbagai laluan kebocoran:
- Kebocoran kapasitor
- Terowong terus
- Kebocoran subambang & GIDL
- Kebocoran simpang
Anjakan Asas dalam Storan
lalu: Storan = kapasiti + kelajuan, Ralat diperbaiki dengan ECC
Sekarang: Storan = kebolehpercayaan jangka panjang + ketekalan keadaan, Storan ialah asas kestabilan sistem
Kesimpulan
Krisis sebenar dalam era AI bukanlah kuasa pengkomputeran yang tidak mencukupi - memang begitu pengekalan data yang tidak boleh dipercayai.
Memandangkan skala NAND dan DRAM 3D kepada geometri yang lebih kecil dan ketumpatan yang lebih tinggi, kehilangan cas dan kebocoran bertambah teruk.Permintaan AI untuk ingatan berterusan menguatkan kelemahan ini.
Untuk membina sistem AI gred perusahaan yang stabil, industri mesti mengalih tumpuan daripada kelajuan dan kapasiti kepada pengekalan, kawalan caj dan kebolehpercayaan jangka panjang.

