• 苹果与英伟达调和,AI模子运算速率普及三倍

  • 发布日期:2025-01-17 14:34    点击次数:140

    苹果与英伟达调和,AI模子运算速率普及三倍

    外媒报谈,苹果最新机器学习手艺,可将英伟达GPU产生教导速率普及近三倍,更快为Apple Intelligence创建模子。

    Appleinsider报谈,创建大型话语模子 (LLM) 的要害,就在产生LLM成果低下,因机器学习进修模子自己即是资源密集且迟缓的经由,只可用更多硬件及增多动力老本捣毁罅隙。

    本年头苹果发布Recurrent Drafter,是普及预计进修发达的解码法。蚁合搜索和动态树RNN(轮回神经汇集)草稿模子,揣度考据多旅途草稿象征,与典型自回顾教导生成比拟,可将每生成要道LLM教导产生速率普及3.5倍。

    苹果机器学习网站著作,透露除了使用Apple Silicon现存任务,并莫得罢手,新呈报详备先容若何诓骗此不绝创建ReDrafter,与英伟达GPU沿途坐蓐。英伟达GPU络续用于LLM劳动器,但高性能硬件老本昂贵,单多GPU劳动器硬件老本就卓越25万好意思元,更无须说其他基础顺次或畅达老本。

    苹果与英伟达调和,将ReDrafter集成至英伟达TensorRT-LLM推理加快框架。ReDrafter使用其他预计解码,英伟达必须添加迥殊元素能力平方开动。集成后使用GPU的ML建树东谈主员,目下可用TensorRT-LLM进行坐蓐时使用ReDrafter的加快教导生成,而不单用Apple Silicon的建树东谈主员。英伟达GPU基准测试数百亿个参数模子后,编码每秒产生速率普及2.7倍。

    终局是该经由可用于最大终局的减少用户的蔓延,并减少所需的硬件数目。简而言之,用户不错期许从以云计较为主的查询中获取更快的终局,而公司不错在滥用更少的情况下提供更多劳动。而显卡坐蓐商暗示,这次调和使TensorRT-LLM更高大、更生动,也使得LLM社应对媒体够革命更复杂的模子,并纯粹部署它们。”

    (首图开头:Pixabay)