苹果与英伟达调和，AI模子运算速率普及三倍

发布日期：2025-01-17 14:34 点击次数：142

外媒报谈，苹果最新机器学习手艺，可将英伟达GPU产生教导速率普及近三倍，更快为Apple Intelligence创建模子。

Appleinsider报谈，创建大型话语模子 (LLM) 的要害，就在产生LLM成果低下，因机器学习进修模子自己即是资源密集且迟缓的经由，只可用更多硬件及增多动力老本捣毁罅隙。

本年头苹果发布Recurrent Drafter，是普及预计进修发达的解码法。蚁合搜索和动态树RNN（轮回神经汇集）草稿模子，揣度考据多旅途草稿象征，与典型自回顾教导生成比拟，可将每生成要道LLM教导产生速率普及3.5倍。

苹果机器学习网站著作，透露除了使用Apple Silicon现存任务，并莫得罢手，新呈报详备先容若何诓骗此不绝创建ReDrafter，与英伟达GPU沿途坐蓐。英伟达GPU络续用于LLM劳动器，但高性能硬件老本昂贵，单多GPU劳动器硬件老本就卓越25万好意思元，更无须说其他基础顺次或畅达老本。

苹果与英伟达调和，将ReDrafter集成至英伟达TensorRT-LLM推理加快框架。ReDrafter使用其他预计解码，英伟达必须添加迥殊元素能力平方开动。集成后使用GPU的ML建树东谈主员，目下可用TensorRT-LLM进行坐蓐时使用ReDrafter的加快教导生成，而不单用Apple Silicon的建树东谈主员。英伟达GPU基准测试数百亿个参数模子后，编码每秒产生速率普及2.7倍。

终局是该经由可用于最大终局的减少用户的蔓延，并减少所需的硬件数目。简而言之，用户不错期许从以云计较为主的查询中获取更快的终局，而公司不错在滥用更少的情况下提供更多劳动。而显卡坐蓐商暗示，这次调和使TensorRT-LLM更高大、更生动，也使得LLM社应对媒体够革命更复杂的模子，并纯粹部署它们。”

(首图开头：Pixabay)

上一篇：问界M9大定19万辆，国产之光成了

下一篇：小米将发布钢铁侠联名版手机配天玑芯片和一亿像素主摄