Le nouveau modèle de DeepSeek réduit les coûts d'inférence de l'IA
DeepSeek dévoile V3.2-exp, un modèle conçu pour réduire considérablement les coûts d'inférence grâce à son système d'attention clairsemée innovant.
posted on 29/09/2025DeepSeek dévoile V3.2-exp, un modèle conçu pour réduire considérablement les coûts d'inférence grâce à son système d'attention clairsemée innovant.
posted on 29/09/2025Google dévoile Ironwood, sa TPU de 7e génération, optimisée pour l'inférence IA, offrant des performances et une efficacité améliorées aux clients de Google Cloud.
posted on 09/04/2025Exploration du potentiel de la recherche au moment de l'inférence en tant que nouvelle loi d'échelle de l'IA, examen de ses avantages et limitations selon les experts.
posted on 19/03/2025