马斯克：实践寰宇顶用于检会 AI 模子的数据照旧所剩无几

发布日期：2025-02-08 14:57 点击次数：163

IT之家 1 月 9 日音问，据 TechCrunch 报说念，马斯克与其他东说念主工智能众人一致以为，实践寰宇顶用于检会 AI 模子的数据险些照旧耗尽。

在周三晚间与 Stagwell 董事会主席马克・佩恩的直播对话中，马斯克示意：“咱们当今基本上照旧耗尽掉了所有东说念主类常识的积蓄…… 用于东说念主工智能检会的数据。这个表象基本上是前年发生的。”

马斯克此番言论与前 OpenAI 首席科学家伊利亚・苏茨克弗（Ilya Sutskever）在前年 12 月的 NeurIPS 会议上的不雅点同样。苏茨克弗曾指出，AI 行业照旧达到了所谓的“数据峰值”，并估量异日缺少充足的检会数据，将迫使 AI 模子的设立花式发生改换。

马斯克以为，合成数据（IT之家注：即东说念主工智能模子自我生成的数据）是异日的处理有盘算。“补充实践寰宇数据的独一阶梯是通过合成数据，也便是让 AI 我方生成检会数据。AI 会进行自我评估，并通过这一自我学习的经过不停优化我方。”

刻下，好多科技公司，包括微软、Meta、OpenAI 和 Anthropic 等，照旧初始使用合成数据来检会他们的主力 AI 模子。据 Gartner 臆想，到 2024 年，用于东说念主工智能和数据分析花式标 60% 数据将是通过合成花式生成的。

使用合成数据的一个权贵上风是镌汰老本。东说念主工智能初创公司 Writer 示意，其 Palmyra X 004 模子险些十足依赖合成数据进行设立，设立老本仅为 70 万好意思元，而一个范畴同样的 OpenAI 模子的设立老本毛糙为 460 万好意思元。

有关词，合成数据也存在一定的风险。征询标明，合成数据可能会导致模子性能下跌，输出效果不仅缺少鼎新性，况且可能变得愈加偏颇，最终严重影响其功能性。因为模子是通过我方生成合成数据进行检会的，要是这些数据自身带有偏见或局限性，那么最终模子的输出也会受到这些身分的影响。