• 20年IT老兵跨界AI:作念一个实用的期间拿来概念者

  • 发布日期:2024-11-26 06:39    点击次数:172

    20年IT老兵跨界AI:作念一个实用的期间拿来概念者

    在刘沛的构想里,一场汽车发布会的拍摄、编著、发布可能要一两个小时,但当今,有了AI,就只需要几分钟的时期。

    传统的东说念主力编著团队被智能化、自动化的机器识别代替,往时要几个钟头的工程当今几十秒就不错贬责。

    这是AI发展的魔力,亦然他所看到东说念主工智能走向将来的后劲。

    2024年,刘沛离开作念了二十年的传统流派网站——中关村在线,来到视频类垂直媒体30秒懂车作念期间总监,操手AI业务。

    一个月前,他指导研讨的基于视频自动生成主题、大纲和图片的家具已经全面镶嵌30秒懂车的多媒体平台矩阵。

    用户不再需要开盲盒式地浏览整个视频,只消在自动生成的主题大纲里挑选我方感风趣风趣的内容跳转播放,就不错了解我方感风趣风趣的信息。

    这款功能上线后,视频完播率和用户响应都有了高出式的升迁。

    ▋ 01 初识AI

    刘沛第一次战争AI,在2022年,阿谁时候他在中关村在线担任CTO。因为名目研发需要,他们驱动用东说念主工智能提高职责着力。

    两年前,莫得若干东说念主系统领受过专科的东说念主工智能历练,都是听到业内的东说念主说好用,便一窝风地去国表里找开源模子,去Google检索教程和学习贵寓。

    刘沛也一样,他唯一的小数基础即是大学时在集合部待了几年,学到了一些经营机的外相,时不可失去考了国度要领员文凭,在毕业后从事了快要20年网站诱导。

    刘沛2001年收用的要领员文凭相片

    网站诱导虽也波及到专科的编程常识,但和生成式AI的逻辑照旧有着质的鉴别。

    网站诱导由前端和后端期间组成。前端认真HTML、CSS、JavaScript、数据库管束和职业器设置等。后端诱导者需要研讨用户界面、处理用户输入、管束数据存储和检索,以及确保网站的安全性和性能。

    而生成式AI,是基于机器学习和天然话语处理期间构建的,提供对话式的交互体验。生成式AI的逻辑更侧重于知道话语的高下文、意图和情态,以及若何生成连贯、关联且准确的回应。

    两年前,大部分企业都还属于AI鸿沟的外行人。

    刘沛率领的名目需要在各大平台获取流量变现。流量获取即是通过专科内容输出吸援用户,然后从外部平台免费获取用户流量。

    用户是被质地蛊卦来的,这需要批量式的优质内容输出,但传统的东说念主工团队着力太慢,一天仅能产出200-300份专科案牍。

    庆幸的是,开源模子给其时还不擅长AI的企业带来了更多可能性和契机。

    恰逢国内清华智谱开源ChatGLM-6b模子,刘沛和共事无用再东说念主工式批量出产UGC、PGC内容,而是基于常识场景制造海量AIGC内容。

    也曾一个团队一天智力产出200到300份的职责量,在AI的天然话语处理期间加持后,一天就不错平直生成1000份。东说念主力团队削减到不再需要编著,唯惟一个审核,对AIGC作进一步的加工、润色,保证内容恰当伦理轨范和法律条目。

    在AI的匡助下,刘沛认真实名目从内容出产、流量获取到最终的生意变现,整个交游额gmv已经过亿,纯利也高出了百万。

    着力大大提高,资本大大下落,利润滔滔而来。

    刘沛称,“这是爆炸式的增长。”

    这种增长也让他知道到,一个独属于AI的期间,正在迟缓揭开帷幕。

    ▋ 02 三个东说念主,两个月,一个名目

    2024年,刘沛入职垂直类视频新媒体30秒懂车,担任期间总监。

    30秒懂车创立于2015年,是一个作念专科测评和深度访谈的汽车视频媒体垂直平台。

    7月份,刘沛和他的团队突发奇想想作念一个名目,基于视频内容生成主题和关键词,让用户一目了然地看到这个视频讲的是什么。

    “当今的视频除了蛊卦流量的短视频,时时不会在滥觞就给出关键信息,而中长视频标题党居多,好多用户看了十来分钟也莫得找到感风趣风趣的片断,便悻悻然退出,视频完播率较低。”

    看到这个缺口,刘沛便想,能不可用AI自动生成一段视频的主旨、大纲,让受众平直找到我方可爱的信息点击不雅看。

    就汽车而言,有些用户想了解车的空间、有些想了解加快度、有些想了解油耗,但受限于视频的单线程浏览情势,只可一帧一帧扒,既费时、着力又低。如果滥觞不够引入入胜,不到一分钟就会点击退出。有了AI索求关键信息,用户可赶快浏览文本关键词精确定位每辆汽车的性能、细节、信息。

    说干就干,刘沛和团队坐窝陈说给CEO,驱动立项。

    但内容上手这个项指标除了UI研讨也就三个东说念主。

    一个前端,一个后端,加上刘沛概括指导。

    名目分为三步走,第一步是准备海量的AI可识别的素材。给AI的素材准确度越高,形容越廓清,AI识别才略就越强、响应质地也更佳。

    第二步是AI的交互流程。交互不是一蹴而就的,而是一个不休面临、迭代,然青年景谜底的流程。尤其是针对汽车行业里的一些专科常识,需要针对性地历练、部署,让模子约略更好地提真金不怕火出关键信息,生成优质的主题大纲。

    第三步主如若后端的职责。为了使模子生成的谜底达到出产级别,后端作念了一些后线的算法加工,最终才达到上线成果。

    这款基于“图像OCR、语音识别 + AI大模子推理”的视频主题索求家具,可依据时期轴精确到秒索求出主旨、大纲、内容致使匹配的图片。在AI辅助下,视频与文本相鸠合,传播着力得到了极大的提高。

    同期,该应用也可感奋图像识别、图形处理、语音识别等批量AIGC需求。

    基于AI自动生成的视频主题大纲

    家具天然优质,但研讨研发的流程并非一帆风顺。

    刘沛的职责,即是对整个家具线实行经营,实时发现可能存在的bug,成立优化。

    比如若何准确高效索求视频内的字幕即是一浩劫题。

    视频自己是一帧一帧图像,索求字幕需要将每一帧上的内容调动为文本。而字幕又分为软字幕和硬字幕,硬字幕自己已经和图片嵌合在一皆,要索求难度更大。莫得字幕的视频,就需要通过音频语音识别,从视频到音频再到文本进行三种神气的变调。

    为了解决这个难点,刘沛和团队分析了上千份影视内容,从情态、大小、字体、神气等维度不休提真金不怕火字幕关键信息,与AI模子进行交互。同期优化算法以提高字幕识别才略和最终限制的响应质地。

    就这么,历经重重费力,这个小而好意思的三东说念主团队花了两个月就把家具作念到了出产级别,解决了用户浏览中长视频的一大痛点。

    这是国内目前首个基于“图像OCR、语音识别 + AI大模子推理”搭建的垂类视频主题索求家具。在这之前,百度天然也研发了访佛功能,但索求内容过于抽象,并不可聚焦于具体的细节、功能、数据,提供有价值的信息。

    功能已经上线,就获取了业内和用户的极佳响应,视频完播率和粉丝量都有了显耀升迁。

    网友指摘响应

    在刘沛最有成就感的几个名目里,期间团队都是小而精,比如,他被CNET China收购的万维家电网,最多的时候也即是十个东说念主。

    2004年刚立项的时候,唯独刘沛和他的爱东说念主。

    他们一文一武,一个认真搞期间诱导,一个认真生意谈判。

    从资讯内容到家具库到生意论坛,整个网站的内容都由刘沛一个东说念主搭建。而找客户、谈互助则是他的爱妻全权认真。

    三年后,万维家电网的生意价值被其时CNET中国高档副总裁、ZOL总司理刘小东看见,一举收购进CNET中国集团,成为CONSUMER GROUP中的一员。

    刘沛2004年创立的万维家电网

    刘沛坦言,这段从零到一的创业经验仿佛奠基了他将来的功绩活命。

    从那以后,他的想维驱动从诱导者情势转向商东说念主情势。他驱动从用户视角看待问题,去看当今市集亟需什么、用户的痛点在哪。

    这相通亦然AI爆发期间企业存活的关键点,即把AI镶嵌到具体的场景之中。

    ▋ 03 一个实用的AI拿来概念者

    刘沛学习AI的能源起原于每一种业务场景的需要。

    当我问到“您若何看待AI和东说念主的联系”的时候,

    刘沛的回应击中要害:“拿来用。”

    他称我方为一个实用的AI拿来概念者。

    在他看来,AI可万物,AI不错跟硬件鸠合,成为马斯克目下能持、能识别物体、能调换的东说念主形机器东说念主。AI可跟软件鸠合,繁衍出各式种种的文生文、文生图、文生视频应用。

    AI的魔力内容不来自于AI自己,而是它多猛进度上约略为东说念主所用、为东说念主造福。

    在生成式AI兴起的一年内,东说念主工智能走向生物科学、应悉心思、天体物理、图文创作、视频编著……

    2022年,DeepMind旗下的AlphaFold奏凯瞻望了卵白质的3D结构,况且研讨出具有特定功能的新式卵白质,在新药和疫苗研发鸿沟功不可没。聊天机器东说念主Woebot行使生成式AI提供心思援手,通过 “复制” 患者与心思大夫之间的 “诊疗揣度”匡助用户松开颤抖和抑郁症状,为莫得钱付不菲商榷费的群体提供了心灵休憩的形势。

    在艺术创作鸿沟,Midjourney不错凭证文本教导词生成格调各种、邃密详尽的艺术作品,海报宣发的制作时期大大勤俭。Adobe的Sensei平台通过生成式AI自动化视频编著,分析视频内容,即使是什么都不懂的艺术小白也可生成转场酷炫的视频。

    AI就像有多半只触角,扩张到东说念主类社会每一个具体可感的旯旮与场景。

    这亦然刘沛所对峙的,将AI与具体的垂类业务场景相鸠合。

    创过业、当过总司理,刘沛最常作念的照旧CTO,据他说,复旧他的是一种崭新感和成就感。

    从我方创业的万维家电网到待了七年的大型IT网站中关村在线、再到当今的垂直汽车新媒体30s懂车,他最可爱一个名目结束时的甘心。看着业务从灵感透露到名目搭建到生意变现,一齐走来,每个方位都有我方的身影,他就感到感奋。

    这种感奋感同期也来自于他为社会创造了更大的价值。

    天然,AI也不例外,无论若何发展,最关键的都是要跟市集和用户需求鸠合,这将是一个企业和家具屹立不倒的最终护城河。