7月,Meta发布开源免费的Llama 2,一经上线便火速俘获全球开发者的芳心,ChatGPT也推出了被称为史上最强功能的「代码解释器」。
眼下,大厂忙着卷参数,创业公司思索寄托开源速成。大家都清楚这波AI机会百年难遇,也都知道大浪淘沙,笑到最后何其不易。现在,大方向是共识,但是具体怎么做没有明确的答案。即使是OpenAI和微软,也在逐渐摸索大模型的产品化和商业模式。行业其他从业者又该以何种姿态,面对席卷而来的AI巨浪?
近日,行行AI和DataFun联合举办了一场“怎么干!冲向AI大潮的技术、产业应用与资本论坛”活动,汇聚AI领域的投资人、创业者、专家学者,共同探讨生成式AI技术的热点话题。至顶科技担任论坛主持机构,CEO兼总编辑高飞担任主持人。
活动现场干货满满、金句频出,基于此,我们梳理了其中关于大模型的技术发展趋势、行业人才需求、中小企业机遇、垂直应用场景以及创业投资逻辑等方向的21个金句,作为《是什么卡住了大模型创业?》的续集,把脉大模型产业发展动向。
从风暴中心硅谷,看大模型风向
美国硅谷未来资本创始合伙人洪淼:现在几乎所有项目都带着AI关键词,但真正让我心动的并不多。目前AI还处在非常早期的阶段,离实用性大爆发还有长远的路要走,在不久的将来会出现AI泡沫,行业会经历大浪淘沙。将来真正的应用是,怎么用大平台的API算法接口,在企业级应用上提高生产力。
硅谷TSVC基金联合创始人Eugene Zhang:硅谷的投资人一拥而上,斯坦福、伯克利AI相关的教授都要出来创立公司,但再过几年很多公司都会出局,大家都在探索中。AI赛道的投资上,ToB应用需要看是否有明确的价值和清晰的买家,ToC应用则更具未知性。
AMINO Capital管理合伙人徐霄羽:我们的投资主线一直都是数据相关,如果没有数据、只有算法,一个大模型的保鲜期也就只有半年。从商业模式上,PLG(产品驱动增长) Saas是大模型落地的一个较为接地气的商业模式,Midjourney就是如此。
Meta AI科学家Xin Liu:很多公司包括谷歌、Meta都在快速投入AI。至于LLaMA 2,它的思路跟OpenAI不同。我们很相信开源的模式,通过开源共享技术。这其中,没有能力训练基础模型的中小企业会更受益,它们可以根据自己的数据和应用场景,来优化模型。
Credit karma数据科学家Michael Cai:AI的基础概念在五六十年前就有了,现在这些GPT产品的出现,其实并不意外。大模型需要大数据和大算力去支撑,而我们不是直接研究大模型的公司,优势在于特有的数据,因此我们专注的方向就是——怎么将这些数据与大模型结合。
Generative Alpha公司CEO、斯坦福大学数学系博士孙卿云:AI经历过几次大突破,比如ImageNet、AlphaGo的出现,但当时AI很难成为一个独立产品,OpenAI的ChatGPT第一次展示了AI作为一个独立产品,可以获得Product Market Fit(产品市场契合)。硅谷现在有两个创业方向:一类是基于以前的AI技术,比如给传统行业做数字化;另一类基于GPT或Llama2这些新技术,探索如何落地。
Pinterest数据科学家陈卓然:Pinterest和目前很多公司一样,对大模型的安全性和隐私信息还有犹豫。现在,技术上还没有完全攻克将大模型和私有数据融合,既有大模型的精确性,又能用企业的内部数据,这个方向我觉得很有前景。另外,如何将AI技术用于产品?社交网络平台会用AI生成一些广告素材,但还未出现完全成熟的产品。
从产业前沿视野,看大模型机遇
行行智能发起人、董事长、顺福资本创始人李明顺:我看到一个巨大的机会,在这波AI浪潮中,哪怕不一定能够站在浪尖,但至少要沾上浪花。我认为任何一行都需要AI的改造和设计,更需要AI人才去实现应用落地。今天很多行业都在减员,而对AI人才的需求,是少数在增长的领域。我们投资了一个开发者社区,每天有约200万技术人员访问,我们希望把上面的IT工程师改造成未来的AI的工程师或AI训练师,赋能各行各业,未来三年我们的目标是培养100万AI人才。
创业黑马创始人、董事长、中国企业家杂志前总编辑牛文文:硅谷在技术的最前沿,但我们要看向硅谷,也要面朝大地。作为一家面向中小企业的科创服务公司,我们在5月底发布了科创大模型,为企业提供科技项目申报材料智能撰写和数据填报服务,我们不追求全知全能,但这对中国千万的中小企业,已是一个巨大的降本增效。我们的价值观是“让伟大人物引领世界,让小人物也有力气面向未来”。我们希望,把中小企业需求与提供技术和模型服务的人才和机构对接起来。
世界说CEO、哈佛Nieman新闻学者安替:ChatGPT创造了一个新的范式,比如原来ToB软件是做企业流程的标准化和自动化,而ChatGPT则直接给结果,从流程的自动化变成了AIGC。但是ChatGPT胡说八道这点,对于企业服务是要命的,还要做好专业数据库的对齐和防逃逸,不能让它被问出你不想让它回答的结果。
汉坤律师事务所顾问律师李潜:这波AI浪潮,对我们法律从业者造成了一定冲击,不过目前AI在法律服务行业主要是赋能者的角色。新一代AI具备很强的学习和逻辑思维能力,市场上一些法律科技的产品和服务,已经能够一定程度上替代律师起草、审阅一些基础的合同或协议。在尽职调查方面,也可以做数据的抓取和整理,并提供建议。
北京协和医学院胸外科教授郭惠琴:之前华西召集了很多主治大夫与人工智能同时处理一个案例,人工智能得到7.2分,我们的医生得到7.5分,几乎没有显著性差异,甚至在某个问题上,人工智能超越了医生的思维。现在,国内外都已经在用新一代AI技术减轻大夫的工作强度、方便患者,这是目前AI对医学最大的一个帮助。
千里马招标大数据平台创始人兼CEO王剑波:AIGC降低了行业成本,重构了商业模式。以前用户有需求,但受限于成本太高无法跑通的项目,现在可以承接了。另外AIGC降低了技术门槛,对底层运营能力的要求反而更高了,同时数据成为企业的一个护城河。
厦门爱尔卓科技有限公司CEO 、91助手创始人熊俊:相比于做大模型,我们更多考虑AIGC在具体行业里的应用,很多公司造航空母舰,总要有人要去开航空母舰。以前流程改造上很多工作是人来做,现在利用AIGC做数据分析,能很大程度简化企业流程的工作,虽然完全由AI执行流程有难度,但在有人类监督的情况下,它是很好的助手。
至顶科技创始人、资深科技媒体人高飞:语言大模型创造了三个层次的创新机会。第一层是「基础设施」。一波技术浪潮崛起的时候,首先要消耗软硬件资源。大模型改变了早年间算力无处施展的问题,甚至需要更多优化的算力供给。第二层是「独立应用」。大模型的应用场景是随语言流动,一切有语言的地方(或者说有人的地方),都可能被大模型所优化,并创造出新的APP。第三层是「融合场景」。IT业永远有技术遗产问题,大量既有的IT系统,行业Know-how如何与新的大模型API相融,也会创造新的商业模式。
从风险投资视角,看大模型创业
华创资本创始合伙人熊伟铭:现在这个行业很热闹,但是目前还没多少结果出来。国内的策略是让子弹先飞一会儿,国际上是特别大的机会。AIGC ToC最容易起量,但是国内做ToC比较难,资本化差,可能得四五年之后,等到互联网的阿里巴巴时刻,才可能出现一些有意义的东西。
真格基金合伙人刘元:我们上半年到现在投了20多个项目,基本都是AI相关。投资理念就是去找最优秀的创始人,所谓投资人就是投资“人”。对于ToC应用,我们会看对方对用户的理解是否深刻,对于增长的方法论是否全面,我们非常希望他们很早就有产品化或者商业化的想法。对于ToB项目,我们会看对方的行业经验。今天很多VC都去投早期,后续的融资反而比较难。
零以创投创始合伙人郑连发:做大模型难度巨大,又要持续投入大量资金,做出来以后卖给谁、怎么应用,都是未知。我们特别讲究最后的效力,只投应用里面变现能力最直接、账算得最明白的。第二层就是投安全,这也跟国策有关。
执一资本合伙人汪天扬:我们以前主要投产业互联网,现在是科技方向,主要是网络安全,聚焦在应用层面。我们的逻辑是平常心,流水不争先,不要用学术的方式思考,用一个工程师实际的思路去思考。现在ToC应用有“网络效应”的还比较少,ToB应用效率工具比较多,深入到垂直行业里的少。
锦秋基金执行董事臧天宇:我们团队主要是两条投资主线,一个「技术主线」是AI和智能化,另一个「商业主线」是全球化,我个人看AI和机器人的方向比较多。看得比较多的项目是应用层,然后是工具链,另外多模态模型和具身智能,我们也有关注。
42章经创始人曲凯:一个量化的感受是,今年大概有100家AI公司拿到融资,其中可能十几二十家做「大模型」,二十多家做「中间层」,剩下的大多数是做「应用层」。现在大多数基金看得多、投得少,市场超快速形成了“AI是大趋势”的共识,但是市场里面又有很强的非共识,到底什么项目能被投?壁垒是什么?其实很多基金想出手,但发现项目有各种各样的问题。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。