Admin
Администратор
Google представила технологию TurboQuant, которая обещает сократить потребление памяти в искусственном интеллекте. Метод квантования переводит данные в формат с меньшей точностью, уменьшая объём памяти для хранения KV-кэшей. Однако, несмотря на заявленную экономию памяти, дефицит не исчезнет. Технология скорее стимулирует новые сценарии использования, требующие ещё больших объёмов памяти. Аналитики прогнозируют рост спроса на DRAM и NAND.