• 马斯克:实践寰宇顶用于检会 AI 模子的数据照旧所剩无几

  • 发布日期:2025-02-08 14:57    点击次数:158

    马斯克:实践寰宇顶用于检会 AI 模子的数据照旧所剩无几

    IT之家 1 月 9 日音问,据 TechCrunch 报说念,马斯克与其他东说念主工智能众人一致以为,实践寰宇顶用于检会 AI 模子的数据险些照旧耗尽。

    在周三晚间与 Stagwell 董事会主席马克・佩恩的直播对话中,马斯克示意:“咱们当今基本上照旧耗尽掉了所有东说念主类常识的积蓄…… 用于东说念主工智能检会的数据。这个表象基本上是前年发生的。”

    马斯克此番言论与前 OpenAI 首席科学家伊利亚・苏茨克弗(Ilya Sutskever)在前年 12 月的 NeurIPS 会议上的不雅点同样。苏茨克弗曾指出,AI 行业照旧达到了所谓的“数据峰值”,并估量异日缺少充足的检会数据,将迫使 AI 模子的设立花式发生改换。

    马斯克以为,合成数据(IT之家注:即东说念主工智能模子自我生成的数据)是异日的处理有盘算。“补充实践寰宇数据的独一阶梯是通过合成数据,也便是让 AI 我方生成检会数据。AI 会进行自我评估,并通过这一自我学习的经过不停优化我方。”

    刻下,好多科技公司,包括微软、Meta、OpenAI 和 Anthropic 等,照旧初始使用合成数据来检会他们的主力 AI 模子。据 Gartner 臆想,到 2024 年,用于东说念主工智能和数据分析花式标 60% 数据将是通过合成花式生成的。

    使用合成数据的一个权贵上风是镌汰老本。东说念主工智能初创公司 Writer 示意,其 Palmyra X 004 模子险些十足依赖合成数据进行设立,设立老本仅为 70 万好意思元,而一个范畴同样的 OpenAI 模子的设立老本毛糙为 460 万好意思元。

    有关词,合成数据也存在一定的风险。征询标明,合成数据可能会导致模子性能下跌,输出效果不仅缺少鼎新性,况且可能变得愈加偏颇,最终严重影响其功能性。因为模子是通过我方生成合成数据进行检会的,要是这些数据自身带有偏见或局限性,那么最终模子的输出也会受到这些身分的影响。