微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 什么是AI硬件的最佳形态?|《原点Talk》Vol.6

什么是AI硬件的最佳形态?|《原点Talk》Vol.6

2026-06-02 19:26
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2026-06-02 19:26 周雅

过去三年来,所有人都在卷模型,参数更大、推理更深、上下文更长。但当Claude Code把Anthropic推到杀手级应用的位置、当OpenAI的Codex已经能替你写完一整本游记,问题终于绕了回来:

这些越来越像「人」的模型,到底要装进什么样的载体里,才算真正走进生活?

手机给不了终极的答案。

iOS和Android不会把底层接口开放给一个第三方AI,让它24小时监听你的环境、读取你的个人信息,这关乎整个移动生态的根基。所以OpenAI自己做硬件,Meta把雷朋改造成千万级用户的入口,理想用1000多块的Livis切入一个“会说话的蔡司眼镜”,Google和眼镜厂商走到了一起做智能眼镜。每一家都在赌同一件事,手机不是AI终极的硬件形态

我们这次请到了顺福资本、行行AI合伙人李云龙,来聊这件事。

李云龙从2023年至今投了50多个AI项目,也是国内最早一批拿到Meta雷朋完全体的发烧友,更准确地说,是一个上下文工程的发烧友。他的办公桌上摆着一堆带摄像头的嵌入式小设备,每一件都在帮他收集自己生活的上下文。他说,他不是在收藏硬件,他是在为未来那个真正能替他干活的“数字分身”提前攒数据。

本期播客,李云龙戴着一副Meta雷朋。他说这副399美金的眼镜,国内同行还远没追上,不光是因为高通把AR1芯片给了Meta一年的独占期,也不光是因为Meta的光波导能做到看不见光栅区,更关键的是模型本身够不够强,能不能撑得起这个“身体”

这场对谈从Meta雷朋千万级用户,聊到Rokid杭州七小龙,从神经腕带的生物电识别,聊到苹果Vision Pro的养生态策略,从Rabbit R1为什么死掉,聊到OpenAI为什么坚持自研。

李云龙抛出了一个判断——这一代智能眼镜距离iPhone 4时刻,可能已经不远了。

【以下为本次访谈的精选内容。】

什么是AI硬件的最佳形态?|《原点Talk》Vol.6

高飞:大家好,欢迎收看我们最新一期的《原点Talk》播客。我们今天要聊一聊AI硬件的话题。

AI这个领域,虽然我们很多时候用的是模型,但是这些模型到底还是需要一个硬件的载体去支撑的。比如我们现在用智能手机,这个AI硬件到底还会向什么样的方向去发展?我觉得这个议题就特别值得探讨。

今天我们也请到了李老师,跟我们一块来交流,他既是这个领域的发烧友,也是这个领域的投资人吧,要不李老师介绍一下自己。

李云龙:谢谢高飞老师的邀请。我叫李云龙,现在在顺福资本和行行AI做技术与产品的合伙人,也在做一些AI行业投资。从2023年到现在,我们大概投了50多个项目。前天跟浙大做了一个孵化器,叫GlobalAI,发掘一些在杭州比较好的项目和人才。也希望有一些好的项目,也可以找到我们,还可以去做一些投资或深入的合作。

高飞:对,一个好的节目必须能够推动商业化变现,希望有相关领域的同学可以到时候联系。

好,我们进入正题。谈到智能硬件,大多数人熟悉的还是智能手机,但是有另外一个智能硬件,就是智能眼镜,这个产品线我称之为是一个“又老又新”的产品,如果说它老的话,我记得当年Google Glass那是好多年前了嘛。

李云龙:2014年、2015年可能。

高飞:如果回过头来看,现在已经过了十几年了,但是直到今天为止,这个产品好像很新潮,却又没有成为大家的主用产品。如果看我们这期视频的同学知道,李老师现在戴的眼镜,就是一个智能眼镜。要不然先从这个眼镜开始,这是哪一款眼镜?

李云龙:Meta的这款,是跟雷朋合作的智能眼镜,但这款不带显示。Meta的AI眼镜应该算是在全球范围内做得比较早。早期,刚才你说的Google Glass,包括后来微软做的,其实后边还有一个公司,就是Snapchat。他们也做了一款摄像眼镜,但他那个眼镜是纯拍摄用的,中间有个摄像头,各种各样的,而且做的造型很夸张,Snapchat也做了几代。

但为什么当时一直没火起来?主要原因就是技术不成熟。可能受限于芯片,还有电池,各种各样的技术限制,以及很重要的AI。当时都没有大模型,只是基础的NLP,它的理解能力也不强,所以当时Google Glass一直都是开发版本,HoloLens到现在为止也没有真正对C端开放,它是ToB的,而且价格很贵,三四万。后来2023年之后,ChatGPT突然火了,Meta也开源了。Meta觉得是时候了,尤其是Meta这个名怎么改的呢,不就是想发展元宇宙。

高飞:元宇宙,对。

李云龙:对,他就一直想做可穿戴的项目,他们一开始做的Quest,VR他们现在做得也是最好的。所谓的最好,并不是说它的效果是最好的,是它的生态,它的性价比,它的用户人群。

虽然它的效果可能不如Vision Pro,但是它的性价比非常高,生态特别好,而且价格很便宜。大概三四千块钱人民币,可能在美国会更便宜。整个生态它完全做好了之后,Google说你能不能把你的改一改给我用?所以Google的Android XR最早其实就是根据Meta的这个改的。

所以,Meta在做智能眼镜方面有长期的积累,其实他们的实验室一直都在做这个事。所以他们直接找了雷朋,这是他们跟雷朋合作的最经典一个款式,这款应该是2024年发布的。这是非显示的。

如果要做成显示的,时间可能会比较长,可能不会很成熟,所以先把显示往后放,把音频、麦克风、喇叭,先把这个做到极致。

高飞:现在你戴这眼镜的话,主要的场景是什么?

李云龙:其实这个眼镜一直没在中国发售,所以呢,在国内它的用途有限。当然我采取了一些手段,已经全面支持了它原版的那些AI的功能。但是对于大部分人来说,其实在这款眼镜里是用不了AI的。

它核心的功能,就是我现在用得最多的,第一个,当个蓝牙耳机用,它不需要塞到耳朵里,我也有Airpods,可能那个是降噪的,这个平时我可能在书店、咖啡厅、跟人吃饭的时候,接个电话很自然,因为你戴眼镜嘛。

另一个就是,有一些场景,可能我出去玩,我手上可能拿着其他的东西,我不方便拿手机拍照的时候,我用它可以直接录像、拍照,我觉得这种场景比较多。但在海外啊,像美国、加拿大,他们都是第一批开放了一些AI的功能,比如AI翻译。两边人戴的眼镜是同一款。我说英语,他说中文,能互相翻译。

高飞:它这个功能是实时的。

李云龙:实时的,大概50毫秒左右的延迟,效果还是很好。

另外一个,它还有一个音频指向的功能,比如说我们在一个餐厅,想听那对小情侣在聊什么,可以打开它一个叫focus的功能,打开之后它会直接指向偷听。所以Meta这个眼镜,之前有一个发烧友叫电丸科技ak,他说Meta做了两件事,一个是把偷拍做到了极致,又把偷听做到了极致。

高飞:哈哈哈,二偷是吧?我怎么觉得这个产品调性很符合扎克伯格这个人的属性呢?因为最早Facebook就是做约会、交友的。现在看来,这个眼镜比较符合交友和社交场景。

我之前看到了一个场景,我不知道是不是真的,说戴上这眼镜之后,原则上我可以拍到一个人,因为只要拍到一个人之后呢,我就可以去查他的LinkedIn,那是不是就可以直接告诉我关于这个人的信息?也就是我社交之前,本来不认识他,开始跟他聊天时,就可以有一些,比如说彩虹屁,说:“哎,久闻大名,我早就知道你在如下领域。”这是一个可能的场景吗?

李云龙:是一个可能的场景。这个新闻也是真的,国外有个学生做的实验项目,他用 API 接上 LinkedIn 和各种搜索引擎,搜到某个人之后直接问:"你是不是某某某?"那个场景对未来来说是可能的,但大厂会考虑一个问题——隐私。这件事能不能推进,取决于当地的政策和隐私环境。像欧盟就很难落地,但在美国我觉得有可能。

高飞:现在雷朋这副眼镜的用户量是多少?几百万这个量级,还是千万?

李云龙:应该到千万了。

高飞:千万这个量级,对 Meta 这种公司来说,千万用户还不算特别大体量——它是一个亿级体量的平台。那现在主要是哪些用户群在用?

李云龙:最早的一批用户群肯定是极客,想体验现在最好的可穿戴设备是什么样的。另一批是对时尚感兴趣、喜欢拍 vlog 的人。因为这副眼镜在海外是在雷朋的店里卖的,他们主打第一人称视角拍摄,所以特别喜欢拍 vlog 的人也会买。

高飞:内容消费和内容创作。那道理上,像我们这样的人群也适合。这副眼镜海外售价多少钱?

李云龙:399 美金。

高飞:其实还好,价格不算夸张。

李云龙:不算贵,我觉得算是很便宜的。其他家很难把价格降到这个程度。

高飞:Meta 做这副眼镜,你觉得是赚钱的吗?

李云龙:一开始我觉得是不赚钱的。它用的芯片不是高通现成的,叫 AR1。这颗芯片是高通跟 Meta 一点点合作磨出来的。这颗芯片最早是用在 Quest 那种 VR 头显上,把它移植到这种很小的 AR 眼镜上,其实不容易,涉及功耗、语音的及时性、稳定性、低延时等等,都是跟高通一点点磨出来的,整个调教过程时间会很长。

高飞:那这么看的话,Meta 或者扎克伯格还是干了一件从0到1的事。如果说高通这颗芯片都是他俩一块磨出来的,等于是从一个定制芯片开始做起,最后做成了一个通用芯片(对高通来说是这样)。

这款产品,如果对照智能手机时代。智能手机最早是诺基亚做的,苹果 2007 年做了 iPhone,把这个产业带起来。你觉得 Meta 这副智能眼镜,离智能眼镜成为主流产品还有多远?1 到 10 来算,比如说一年三四亿台出货算主流产品,现在它处在历史进程的哪一阶段?

李云龙:我觉得有点像 iPhone 4。

高飞:iPhone 4?那已经算比较成熟了,这个评价比我想的高。

李云龙:对,因为我们接触到的这副 Meta 眼镜,并不是它的完全体。它在海外是有完全体的——我戴的这副不带显示,但还有一个 Display 版本。Display 版本我上个月一直在用,因为我朋友买了,我就一直在用。

它配了一款神经腕带,戴上之后,你的手势识别方式跟苹果 Vision Pro 那种靠摄像头识别完全不同,它是靠神经腕带的。包括眼镜显示的亮度、效果,跟国内这些产品差距非常非常大。

高飞:不是同一个 level。

李云龙:完全不是同一个 level。而且刚才说的那颗 AR1 芯片,高通跟 Meta 调校出来之后,高通给了 Meta 一年的独占期,一年之内不能供货给其他厂商。所以其他厂商想用 AR1,至少要在一年之后,这是一个断层式的领先。

另外,Meta 那款 Display 版本,它能做到全彩。国内那些产品做的都是单绿,像 Rokid、夸克,他们用的都是单绿,Meta 那个是全彩。

但 Meta 也有局限,近视度数最高只能支持到 400 度,超过 400 度光反射会受影响,质量会下降。

高飞:因为曲率的原因。

李云龙:对,没法做到 400 度以上,这是局限。

高飞:那它把我排除在用户之外了。

李云龙:把我也排除了。我没买的主要原因就是我正好在 500 度左右。

高飞:我是450度左右。

李云龙:刚好超了。它散光倒还可以,但近视度数不能超过400度。另外它的电池也相对没那么好。如果一直开着用,一两个小时就没电了。

高飞:你戴的款眼镜续航多久?

李云龙:拍照的话能拍几百张。录像 45 分钟。

高飞:也没多久。

李云龙:因为它单段视频最长就 3 分钟。

高飞:单段视频 3 分钟,总共能拍 45 分钟左右。

李云龙:对。如果只当音频眼镜听歌,五六个小时没问题。

高飞:那带出去一天应该问题不大。

李云龙:问题不大,而且它有个眼镜盒可以放进去充电。

高飞:对,那刚才你也提到了,国内的同行,还不能叫友商,因为可能不在一个 level。这里头不知道大家注意到没有,李老师提了一个神经腕带,这好像是一个比较新的技术,可以理解为通过手腕或手部动作做一些微操作来控制眼镜功能?

李云龙:对,这目前应该是 Meta 独占的一项技术。2024 年 9 月份,Meta 有一个发布会,发布了一款眼镜叫 Orion,一副眼镜的成本就 1 万美金还是 10 万美金,我忘了,反正非常贵。当时只展示了原型机,黄仁勋还戴上了那副眼镜。它能做到什么程度?框比我现在戴的稍大一点,但体验跟 Vision Pro 差不多,Vision Pro 多重啊?六七百克。它只有 80 多克。

高飞:差了接近七八倍。

李云龙:对。而且它有一个单独的计算单元,把计算模块拿出来,通过无线连接。当时我觉得最震撼的不是它做得这么小,而是它的交互方式,竟然用了神经腕带。戴上之后能识别手势,识别得特别准。我一开始以为是噱头,怎么可能识别那么准?结果上个月我真用了,他们把这项技术优先下放到了第一代 Meta Display 上,我直接用了,效果非常震撼。

高飞:能不能稍微描述一下,这个神经腕带操作和我们理解的普通手势操作有什么区别?大家比较熟悉的是手势操作,需要把手对着摄像头挥一下,那神经腕带是什么逻辑?

李云龙:它可以放在兜里。

高飞:把手放在兜里?

李云龙:对,手放在兜里。我们的手在动的时候,会发生一些细微的电变化。

高飞:生物电,对吧?

李云龙:对,生物电。各种细微的变化。这本质上也是有了 AI 之后才做到的,他们用了大量训练数据。

高飞:有点像机器学习,知道不同手部动作对应的生物电特征。

李云龙:对,然后把算法集成到腕带里。

高飞:举个例子,两个手指捏一起和三个手指捏一起,或者旋转一下,生物电就变成一种可识别的模式或特征,这种模式再跟眼镜里的操作做对应关系。

李云龙:就类似电脑鼠标的左键、右键。它确实有旋转。

高飞:有旋转?

李云龙:对,有旋转、有长按、有捏一下,各种功能。

高飞:而且它不需要摄像头看到,我手放兜里,一捏就能拍照。

李云龙:每个手指它都能识别,食指、中指它都能识别。

高飞:需要训练吗?还是上来就能用?

李云龙:不需要训练,但需要它教你一遍,你操作一遍就行。

高飞:那说明手部生物电每个人的特征都差不多,不需要额外建模?我记得用其他一些设备的时候要经过一轮建模,像 AirPods 都需要,得转一下头。这个不需要?

李云龙:不需要。是一个相对标准的。

高飞:很先进的技术。

李云龙:但这个"标准"背后,是他们在这方面下了很大的功夫去研究、训练算法。我觉得 Meta 这一块的技术还是很厉害的。

高飞:谈完海外,我们回到国内玩家。你觉得国内这些玩家现在处在一个什么阶段?主要的使用场景是哪些?

李云龙:国内的我用过 Rokid Glasses,两个镜片都是绿色那种。Rokid 这款产品现在也是国内卖得最火的,他们融资轮数也是最多的。现在好多国企,包括一些做眼镜的都跟他们合作、投资。他们是杭州七小龙之一。

高飞:七小龙,现在是六小龙加宇树。

李云龙:对,Rokid 我觉得很厉害。第一,发布得够早,是国内第一批发布 AR 眼镜的。第二,他们的生态足够成熟。

所谓生态,第一是他们最早跟高德合作做了眼镜导航;第二是接了足够多的模型,海内外版本都把模型接全了,国内的 DeepSeek、通义千问各种模型全接了,国外的 ChatGPT、Claude,新的一出来立马就接。

他们对生态建设非常积极,开发者版本、各种 SDK 更新得非常频繁,甚至在眼镜上做了一些小游戏。因为他们的芯片也是用的 AR1,AR1 可以跑安卓。虽然我觉得有些方向不太对,比如非要在眼镜上跑游戏,没什么意义,但生态有人玩,说明社区建立得不错。最常用的还是宣传的那些:翻译、拍照、支付、导航,基本就这些。

高飞:也就是说这款产品魔改空间比较大。这让我想到以前玩路由器,应该是华硕路由器,大家很喜欢刷固件。

李云龙:梅林。

高飞:对,梅林。所以那个路由器形成了一个广大的粉丝群体。Rokid 也有这种特征。

李云龙:而且是官方支持。

高飞:官方支持大家一起魔改。那还有哪两家?比如夸克是什么情况?

李云龙:夸克他们整个硬件设计团队非常用心,做了很多硬件优化。比如他们后面那块电池,换电池的时候是不断电的,里面有一个足够大的电容,能保证你 5 秒、10 秒不断电。

高飞:那么大电容吗?有点夸张。

李云龙:他们做了一些细节优化。

高飞:能看到一些小细节的用心。

李云龙:但国内这些带显示的眼镜,包括夸克,都有一个很大的问题,就是光栅区。比如我们对面聊天,你能看到我这有个屏幕。

高飞:就是那个绿色的,很明显。

李云龙:对,那叫光栅区,一直在那闪。但 Meta 一点都看不见。

高飞:这个能看到和看不到,工程难度差在哪?

李云龙:非常大。它是靠光的折射,光在里面不停折射。

高飞:光波导,对吧?

李云龙:对,光波导技术。国内这些用的都是同一家公司的方案,比较成熟,但没法规避光栅区的问题。

Meta 的解决方案问题在哪?出厂的时候这个镜片必须是他们配的。夸克也是这样,但夸克只解决了"够薄"的问题,它出厂也是要现配,买了无度数的之后不能再加度数。Rokid 是有一个夹片,跟墨镜夹片一样放上去。夸克只是把它变薄,但光栅问题还是没解决。而且光栅这个事解决起来,是需要基础科学团队的。

高飞:属于物理、材料这个领域。

李云龙:而且投入很大。所以目前这块技术又是 Meta 独占,只有 Meta 解决了。

高飞:这个其实挺影响用户体验的。比如我们两个交流,看不到光栅,我会默认我们就是正常交流;但看到了之后,我可能会心里有点不舒服,觉得你在分神。我们俩聊天的时候,你已经神游天外了,是吧?特别是想象一些约会场景,女生正在说话,男生你是不是已经在收发邮件了?是不是在打工?还是在专心看电影?这个影响挺大。

李云龙:对,有时候有可能闹情绪。

高飞:跟我在一起,是不是还在收邮件?是不是在装 Claude?大家会想得比较多。所以我觉得这种细节问题有时候会决定消费级产品的成败。

李云龙:对,这也是目前 AR 眼镜最大的问题。国内没有任何一家公司能解决,只有 Meta 解决了。

高飞:那如果谈非显示的眼镜,比如理想推了一个 Livis,它是不带显示的,只有音频、耳机,我称之为"音频版智能眼镜"。你怎么看这类产品?

李云龙:理想这款出来之后评价特别好。评价好的原因是,它只解决几个痛点。

第一,它单纯就是替代一个蓝牙耳机;第二,反应速度很快,用单音节激活;第三,里面用了一个很小的端侧模型,没有 AR1 那么重的芯片,续航能保证,延时非常低;第四,它非常轻,因为没有额外组件,用的芯片也足够省电;最重要的是价格,1000 多块钱,蔡司的镜片,一下就卖爆了。

高飞:因为一副普通墨镜有时候也卖这么贵。

李云龙:对,它做这件事的逻辑是,首先把它当成一副眼镜来做,而不是先当成一个电子产品、数码产品。

高飞:所以李想这个人做产品还是有点道行的。

李云龙:对。其他家都在用同一颗芯片,恒玄 2700、2800 那种芯片,加上AR他直接不用,只用一个最基础的方案。

高飞:因为它的功能足够单一,只解决麦克风和录音的问题,所以也不需要那么高性能的芯片。

李云龙:对。

高飞:那它的使用场景是和车机交互吗?

李云龙:跟车机交互是一部分,但我觉得更多还是平时的场景,比如听歌、拍照。

高飞:相当于眼镜版的蓝牙耳机加上一个拍照设备。那这样也谈不上是智能眼镜,顶多是个感知设备。

李云龙:但它可以通过蓝牙连到手机上,唤醒手机的 AI 助手。

高飞:用手机的算力来解决眼镜的智能交互问题。

李云龙:它其实没用手机的算力,用的是云端算力。

高飞:云端算力。那是模型优化得好或者链路优化得好,所以低延时不错。

李云龙:对。其实我们忽略了一个问题,理想这家公司前段时间发布了自己的车机推理芯片。他们有能力自研推理芯片,所以完全可以自己生产芯片去跑自己的小模型。

高飞:所以理想也算是一家有端到端能力的公司。

李云龙:对。

高飞:聊完这几家,还有两个重要玩家可以聊聊——苹果和三星。智能硬件时代这两家是曾经的两个第一,苹果是智能手机的开创者,三星是后来居上的全球第一(除中国市场之外)。现在这两个玩家市场上怎么看?

先说苹果,Vision Pro 你觉得处在什么阶段?苹果接下来可能会做哪些事?正好过两天苹果的开发者大会要开了。

李云龙:Vision Pro 这个设备是一个试验田,它是未来苹果做 AR 眼镜(像 Meta Display 那种版本)的试验田。

到现在为止,Vision Pro 卖得也不多,基本是发烧友、极端发烧友,加上一部分开发者用户,再加上一些开店做演示用的。比如租赁演示。

但他整个生态做得特别好,因为系统底层用的是 iOS 和 Mac,APP 现在也已经不少了。当生态做得足够大的时候,他把这个设备的体积做到普通眼镜那么大,一下就起来了。

高飞:所以可以理解为他用这款产品养了一个生态。等生态养起来、硬件 ready 了,这个产品还有很大机会。

李云龙:对,他现在就是在提前布局生态,先让真正觉得有用的人去玩,去给他开发所有 APP。我觉得这步棋下得挺好。

高飞:比较长久。他并不是把这个产品当作临时性、阶段性的产品?

李云龙:一定会继续做下去。可能会换一种形态,比如做得更小,可能会出 AR 版本,这不确定,但这个生态他一定不会放弃。

高飞:三星在这个市场什么表现?

李云龙:三星前段时间也发布了一个 XR 设备,我看评测说一般,就是谷歌原生 XR 系统搬过来。三星的问题是生态问题,其实不光是三星的问题,是谷歌安卓的问题。

高飞:太碎片化了,对开发者的影响力不像苹果那么紧密。

李云龙:因为它的系统是谷歌的,手机又是自己的。不像苹果系统、芯片、设备都是自己的,这就是它最大的问题。Meta 起码还深度魔改了安卓,自己做了一套生态。三星压根没去做生态。

高飞:这么看的话,三星能不能在智能眼镜上做好,很大程度上依赖谷歌。如果谷歌足够努力,三星可能跟着带飞。三星其他工程能力很强,芯片、显示,所有硬件都不缺,只要谷歌把软件解决了就差不多。我们稍后聊模型那段时谈谈谷歌吧。

我们先跳到另一家公司——OpenAI。众所周知,OpenAI 是一家对智能硬件怀有极大热情的公司。在 Anthropic 的 Claude Code 借着 AI Coding 把 OpenAI 打得稍显狼狈之前,OpenAI 的主要精力是放在消费产品和消费硬件上的。Anthropic 用 Coding 把它的收入和估值打下来之后,OpenAI 才稍微放弃一点热情。但我觉得它在这个领域应该也是认真的。

刚才录节目之前我跟你聊了,OpenAI 跟苹果前首席设计师乔尼·艾维(Jony Ive)的公司 LoveFrom 合作。

李云龙:对,好像是。

高飞:好像叫 LoveFrom 什么的,OpenAI 还把它收购了。目前透露出来的产品方向,最初看起来有点像 Humane AI Pin 那样的产品,好像没什么太多技术含量?是不是我得到的信息不够?李老师怎么看?

李云龙:是这样。在 Anthropic 做 Coding Agent 和 Claude Code 之前,OpenAI 整个都在为 C 端服务,它想在 C 端占足够多的份额。Anthropic 是 To B 的。

所以 OpenAI 这家公司有不同团队做不同的 C 端产品,硬件也是他们比较看重的。我觉得主要原因可以一句话总结——OpenAI 认为,AI 的终极硬件形态不是手机

很简单,手机分成两大阵营,安卓和 iOS,也就是谷歌和苹果。他们不会在底层开放接口,让 AI 全天候监听你的环境、读取你的个人信息,一定不会开放这个口。

但 AI 发展到现在,最重要的不是后面的模型有多大,模型可能已经是上一轮的事了。现在到 OpenAI,为什么一出来大家都觉得这 AI 像是一个人?原因就是足够多的上下文,它要足够多地了解你,你才会觉得它真正好用。

所谓"足够多的上下文",普通人的上下文哪有那么多?其实就是每天的生活工作,这需要硬件去记录。手机不开放这个口,OpenAI 就只能自研。

它现在曝光了两款硬件,一款是耳机,另一款是带摄像头的。

高飞:好像就是一个装在口袋里的,一个别在身上的。

李云龙:为什么是这两种形态?耳机主要是听你个人的声音。

高飞:比如我自己的想法。

李云龙:对,碎碎念、好的 idea,赶紧说一下,AI 把它记下来。

另一方面是记录环境信息。举个例子,我们开会,可能有人在放 PPT,有个大屏。开会光靠麦克风不够,你又不可能一直拿着手机拍。所以那种硬件可能每隔 5 秒或 10 秒拍一张环境图,把照片给到 AI 去分析。再加上环境音、周围信息,可能还有更多传感器,把这些作为上下文给到 AI 之后。举个例子,我出去玩了一天,晚上它自动给我生成一个游记、自动给我剪辑一个视频。

我前段时间不是去澳门嘛,正好在那待了一天,我就想试试这个事,到底能不能做到。我用眼镜疯狂拍照,因为电池不行,只能拍照,去到每个地方还拿着手机不停地讲:"我现在在哪,我的想法是什么,我为什么觉得这怎么样。"晚上回来,我把这些都导出来,转成文本,眼镜的照片直接导出来放进文件夹,丢给 Codex,让它帮我整理生成一份游记。生成出来图文并茂、有目录,特别好。

高飞:很完美。

李云龙:对,当时就觉得未来一定会有这样的硬件。

高飞:你等于是手搓了一个,通过模型、Codex、眼镜手搓了一遍。但未来这个硬件应该是工程化、规模化的,可以丝滑地把这个任务完成。

李云龙:对。其实很多人都想记录生活——你看大疆 Pocket 为什么卖那么火?每个人都想记录。但发愁在哪?他们不想剪辑,不会剪辑。

高飞:我只想拍、只想录。

李云龙:我想记下来。

高飞:不想有后期工作。跟我一样,我一直想做视频,但后期对我来说太难了。

李云龙:很痛苦。包括写小说、写书也一样。那为什么不让 AI 去做这件事?我只要结果就好。AI 看到的跟你看到的是一样的东西,相当于把你的人生记下来了。最后这些上下文,视频也好、整理出来的小说、自传也好,是未来真正的数字分身的那一步。

这就是为什么 OpenAI 一定要做硬件。它认为手机不会开放这种接口,手机不是最终的 AI 硬件形态。

高飞:就像豆包一样。做完之后发现谁都拦着它、防着它。手机本来就不是一个为"记录上下文"准备的产品,手机更像一个身份认证系统,接了银行、证券、身份证,它已经变成我们的数字指纹。当年办什么业务都要去银行,现在拿手机就行,所以从底层上手机就没法做这件事。

李云龙:手机上不愿意开放,是因为这些 APP 厂商如果把口开给豆包,他们就没了。

高飞:豆包就把它们跳过去了。

李云龙:对,因为最终就是一个对话框就够了。

高飞:有道理。

李云龙:但未来我觉得这件事怎么逃都逃不了。

高飞:那这里的问题是,为什么 OpenAI 做的产品不是眼镜?现在流传出来的,要么装口袋里、要么别身上,为什么不做眼镜?当然这个也没什么实证,没准它推出来就是眼镜。你怎么看?

李云龙:我觉得眼镜还是有一些弊端的。

第一,有些人不喜欢戴眼镜。第二,眼镜不是一个 24 小时能追踪你的形态,晚上眼镜可能需要充电,要放到其他地方,而且不方便换电池。小硬件就可以随时换电池。第三,是隐私问题——摄像头。硬件揣在身上的时候摄像头是关的,戴眼镜的时候摄像头始终开着,对面的人会不放心。所以眼镜有局限性。

高飞:没错,如果一屋子人每个人都戴这种眼镜,对社交会形成巨大影响。我们必须默认每句话都可能被拍下来传出去。

李云龙:所以我觉得眼镜可能会做,但不是第一批。第一批更可能是耳机或者挂在身上的摄像头。

高飞:这类产品其实早两年火过。大概两年前 MWC 的时候,有几个产品像 Rabbit、AI Pin。那时候叫 AI Pin。那时候没做起来,为什么?

李云龙:Rabbit R1 没做起来,一个原因是它只是在安卓上稍微改了一下。当时 Agent 也不成熟,它想替代手机,但其实替代不了。它想在上面点外卖、打车,但当时实测点外卖必须走五六轮,因为 Agent 能力不强,模型能力不强,而且模型也不是自己的。它要替代手机,怎么可能替代?我还要拿手机看视频、刷视频,它那屏幕那么小。

高飞:明白。这么看,当年的步子迈得有点大。它把自己定位成了手机的平替。当年 Google Glass 也是想做手机的平替。而现在 OpenAI 做这个东西不是手机的平替,是模型的眼睛、耳朵、嘴巴,是模型的外延身体

李云龙:Rabbit R1 没做起来的主要原因是模型能力没达到,而且他们自己没有模型,说白了就是没有大脑,只做了个壳。

高飞:等于两头在外。硬件也就那么回事,又没有模型,本质上是个套壳,而且是缩小版的套壳,没有那么多机会。

李云龙:但 OpenAI 不一样,它有大脑。

高飞:有大脑。

李云龙:模型能力足够强,现在就是缺个眼睛。

高飞:对。

李云龙:你看 Claude Code 不就是一个控制电脑的"手"嘛,它一下就火了。

高飞:有道理。哪怕在手机里装 Codex,然后能控制一下电脑里的 Codex,这都是一个场景。OpenAI 希望从一个聊天窗口延伸出来,进入到生活的更大范围。

那说到这,有一个玩家没聊到——谷歌(或者说 Alphabet,旗下的 Google、Google DeepMind)。它有两个方向值得聊:第一是安卓生态如果要把眼镜做好,离不开谷歌;第二是它在模型领域也有很强存在感,前两天推了一个 Gemma 4 端侧模型,李老师有没有体验过?现在评价如何?

李云龙:Gemma 4 现在应该是开源端侧模型里能力最强的,比如 4B 模型这个量级,它可能是最强的。

高飞:断崖领先?

李云龙:断崖领先。他们的 2B 和 4B 我已经移植到鸿蒙原生 Next 系统上了,我已经开源了。

高飞:这是手搓,把两个生态搓在一块了。

李云龙:底层是阿里在适配,阿里做了一个手机的极简推理框架,我只是适配了一下。效果还不错,也就是说现在在端侧运行模型是可能的,但只是运行模型而已。

高飞:他没有额外的东西,只是把模型跑起来。那这个产品对未来智能硬件的作用有多大?端侧模型是不是必须的?还是说通过网络带宽加云端模型就可以解决?

李云龙:端侧模型和云端模型都需要,要做协同。现在有一个比较好的案例——苹果的 Apple Intelligence,端侧加云端。它做得好的地方是云端和本地的协同。

为什么需要这种协同?因为本地的模型要保障你的隐私。比如 Apple Intelligence 有一些功能,像总结你的推送,一小时来 20 条推送,直接给你总结一下。但这个总结要传到云端,可能涉及微信消息。

高飞:微信的、银行的,各种信息都可能有。

李云龙:你让云端做就不太合适,但用 1B、2B 的模型本地做总结就足够了。

另外,个人信息(比如今天走了多少步、心率、各种健康数据)传到云端也不太放心,有些人就在乎这方面的隐私。靠本地模型是够的。所以本地模型不像传统大模型那样追求极致通用,而是某种场景下能用。这是必须的。

高飞:说到隐私这事,大家可能没感觉,但前两天我作为微博 AI 博主,大家吵得最热的一个话题就是 DeepSeek 的 thinking 思考过程泄露了,可能是 KV cache 没管理好,你打一个 think 标签给 DeepSeek,它会随机显示别人的思考过程。

这部分道理上不算用户隐,因为不是用户输入的,但里面包含了用户输入的部分 prompt。比如有人问"我遇到什么问题应该怎么解决",里面就把这个问题说了。测试了一下,确实直接返回了很多。其实这是一个隐私问题,万一碰到坏人,把思考过程泄露出来,往小了说是个人隐私,往大了说工作中可能出现泄密。这其实挺吓人的。

李云龙:这是工程上的安全问题。如果你足够在乎自己的隐私,就不要用这种在线模型,自己搭一个。当你给到 DeepSeek 的时候,背后的安全就......

高飞:你已经交给别人了。

李云龙:对,就不好说了。

高飞:既然你已经用云端模型了,就别指望这事在你家保险箱里。

李云龙:对。所以好多企业还是想自己部署一个小一点的模型,比如 80B、100B 的。

高飞:今天,准确说应该是昨天,戴尔召开了全球技术大会,请了黄仁勋到场,麦克·戴尔和黄仁勋做了一场对话。我仔细看了一下,他们的核心对话是说有好多企业向戴尔要求把模型放在本地。

这种模式国外跑得还挺有意思。比如 Google DeepMind 把 Gemini 3.1 部署到用户的数据中心做本地推理。我们在国内用云的时候好像是直接在他们的云上用,但它不是,是你自建数据中心,谷歌把模型推到你本地,跟原生使用差不多。等于谷歌和算力公司帮你做一个模型的本地推理版本。这种模式你怎么看?

李云龙:我觉得从模型发展来说,这是介于闭源和开源中间的一种选择。

高飞:它还是闭源的。

李云龙:相当于一种本地部署。其实这也不是第一家做这事的,他们和 Amazon、Cursor 都做过类似的合作。当一家企业想用业界最好的模型,但又不想把数据给模型公司,这个选择我觉得是可以的,双方共赢。

高飞:早期智谱 AI 也做了很多本地化私有化部署。开源之后用户可以自己买算力和推理引擎部署,但闭源时代确实是这种方式。

李云龙:在一些场景是够用的,它不需要那么快迭代,可能觉得 Gemini 3.1 Pro 的性能足够了,一两年内不需要换。但另一部分企业想时时刻刻体验最新模型,这种你给他部署也比较难,因为模型公司懒得更新。

高飞:如果这些公司足够有钱,模型公司为什么要拒绝呢?你要私有化部署,我就给你一份。

那刚才你也提到,来录节目之前你正好去了一家被投公司,是做硬件的吗?

李云龙:可以这么讲。它就是一个Claw盒子。但我们不是那种比较泛的Claw盒子,我们针对具体的行业,比如酒店类、潮玩玩具类,给他们预置了一些 Skills,直接给老板用。他不需要自己折腾安装那些东西。

本质上这是一台 Windows 小主机,我们给它完全魔改。软件直接就是 Claude,所有 token 走我们的平台。Skills、tools(比如生图、生视频)都已经接好,开箱即用。

高飞:而且垂直到某个行业了,更端到端,开箱即用的味道。

李云龙:对。如果做泛化、通用的,我觉得机会不大。因为通用的东西,大模型厂商会把你干死。只要一个东西非常通用,大模型厂商一是有这个能力,二是觉得这个市场太小。

高飞:可以等,等你把市场做起来我再做。

李云龙:对,Anthropic 一直在做这个事。

高飞:等创业公司把应用做得差不多了,Anthropic 就下场。

李云龙:对,Anthropic 一旦发布一个新产品,一大片创业公司......

高飞:哀嚎。这家公司真的是杀手级,不是杀手级应用,是杀手级公司。太恐怖了。现在谷歌对智能眼镜这个产品关注度怎么样?

李云龙:还挺关注的。他们跟国内一家公司 XREAL 在做深度合作,想先把眼镜里的 Pixel(他们手机叫 Pixel)先打造出来,他们也想做生态。谷歌不是要一家独大,他一定要把生态建起来,因为现在眼镜最大的问题就是生态问题。

高飞:内容和应用的问题。

李云龙:对。你没有杀手级场景。现在你说 AI 眼镜有什么杀手级场景?我觉得最基础的就是拍照和录像,这就是最杀手级的。

高飞:我觉得 Meta 那个 Focus 是个杀手级场景,在某个场景中偷听。偷听跟偷拍那是杀手级,只有杀手才会用的产品,哈哈。

好,我们还有一个公司没聊,但其实一直无处不在——高通。似乎不在,但又无处不在。刚才你提到高通在这个领域是独占级别的,跟 Meta 合作研发了这款产品,应该说是这个领域最好的一颗芯片。

李云龙:对,但这颗芯片其实算比较老。比较老的原因是行业内没有人跟它竞争,友商不努力,只有它自己一颗芯片。所以 AR1 现在耗电量还是很大。如果把这块解决了,性能是足够的。另一个问题是没有哪个场景、哪个应用能把它的芯片跑满。

高飞:算力没用足。

李云龙:这是最大的问题。其实真正用 AR 跑的那些 APP 都没用到它的算力,纯端侧的算力几乎没用到。

高飞:这是一颗 SOC 吧?

李云龙:是 SOC。

高飞:那就是把通信等模块都集成在里面。

李云龙:对,都集成在里面——蓝牙、Wi-Fi 全在里面。

高飞:这事确实只有高通能做。给不太了解的同学一个背景,做一颗算力芯片不一定那么难,AI 时代就是矩阵运算,这事不太困难。但做 SOC 是另一回事,蓝牙、通信这些模块,第一有大量技术,第二有大量专利积累,一般公司玩不了这种芯片。

我记得早几年,英伟达想做一款手机芯片,做了一段时间发现做不了,专利护城河太深,就放弃了。后来这款产品去掉了通信能力,变成一个相对纯计算单元的芯片,用在了汽车上。

所以这个领域高通确实是独一无二的玩家。高通每年的骁龙技术峰会,我们的记者每年都参加,确实感觉每年峰会里都有一个环节关于 XR、AR,感觉高通也没放弃过这款产品。

我记得是去年,高通 CEO 安蒙也说,他们一件事做了很多年,当时他举了 5G 的例子,说当时大家觉得这事没什么可说的、放弃了,但他们还在做。

元宇宙这件事好像大家也觉得不那么重要了,但高通一直没放弃,从实际情况看确实如此。一直是这么一家专注的公司。

最后我们花点时间聊聊李老师的另一个主业——投资。请李老师谈谈,不止于 AI 硬件,泛 AI 范畴现在你看到哪些好的机会?什么样的项目你比较看好?什么样的创业者你比较看好?因为有时候投项目其实是投人,我们可以从两个维度分析。

李云龙:从创业者的角度,第一个就是专注度

高飞:专注度。

李云龙:他可能一直在做这件事,创业有几轮了,一直做一件事。首先这个人是不会放弃自己创业项目的——或者会换一些赛道,但一直在创业。这种人我觉得可以。

另一种是本身背景特别好,而且一直扎根在这个方向的。比如做机器人模型、具身智能模型的,他可能从硕士、博士阶段就一直扎根在这个方向,毕业也想从事这个方向创业。

高飞:没准小时候就有这样的梦想。

李云龙:对。这种人从人的角度是可以的。一种是刚毕业还没毕业的,一种是一直在创业的老兵,始终不渝不放弃。这种我们会加分。

从项目角度,这几年我们投项目,因为 AI 发展太快,每一年看重的东西不一样。今年我们更看重端到端的交付,AI 在中间可能帮你节省成本或提高效率,但最终交付给用户的那个产品,是不是用户喜欢的、想要的。就像我们刚才说的那个Claw盒子。

高飞:那正好是端到端解决了用户痛点。

李云龙:对,一定是端到端的。如果你只是中间某个环节,举个例子,最近很火的各种 AI 生成短剧的平台、工具,我觉得意义不大。原因是工具平权,创意不会平权

字节自己做的那个小云雀做 AI 短剧,一个非常厉害的导演跟我同时用那个平台去生成一个小电影,谁做出来的品质更高?肯定是那个导演,因为创意、经验都在他脑子里,工具只是同样的工具。

很多人觉得 C 端工具一出来"我也能做视频、做短剧",但没真正对比过,真正有经验的人做出来是什么样的产品。

短剧现在很卷,我们投了几家短剧公司。去年我们投这种工具类的产品可能还会投,但今年我们不这样看了,需要你提供端到端的解决方案。

原来的方向可能是 80% 懂 AI、20% 懂业务就够了。现在反过来,你要 80% 懂业务,在某个方向有沉淀、有自己的 know-how,20% 懂 AI。因为现在 AI 模型能力足够强了,你只要稍微懂一点,用 AI 就比原来花 80% 精力做得好得多。

高飞:也就是模型这件事被商品化了、平权了。但对业务的洞察、行业的积累,这个东西很难平权。如果能把这种行业洞察和积累产品化,让另外的人拿来直接交付一种结果。用一个比较庸俗的话说,原来这种工具有点像 SaaS,哪怕用 token 计费,也是按时间或量计费的产品,我都称之为变种 SaaS。

而你说的这个有点像以结果付费——Result as a Service,直接交付一种 KPI。这样的产品可能会变得很有价值。

我能最后再问一个个人的小问题,李老师为什么个人这么关注智能眼镜、消费硬件?这东西第一不那么成熟,第二还挺贵的,这个热爱是怎么养起来的?刚才你也提到,很多时候把一件事做好是热爱产生的。

李云龙:其实我做这些事,首先因为我懒

我买 Meta 这副眼镜,是因为我不想拿着手机举着去拍照、录视频。但我又在 AI 行业,知道未来的 AI 要想足够懂你,一定要有足够多的上下文。所以我会买大量这种能获取个人和周围上下文的工具——眼镜、手表,还有办公桌上摆的一堆嵌入式小设备,上面带摄像头,可以扫小字,各种各样的东西。包括 AI 转录的那种硬件,我自己也写了一个。

我弄了一堆这种东西,本质上都是在收集我的上下文。为了未来那个足够好用的数字分身。数字分身是要帮我干活的。所以本质上还是懒。

高飞:明白。所以大家不要误解,李老师不是消费硬件发烧友,是上下文工程的发烧友。最终是为了练出自己的,要炼丹嘛,个人炼丹,元婴二期,根据上下文修出来的 AI,最后能帮我们干活,让我们更多享受生活。也就是懒。我觉得这才是最终目的。

李云龙:对。未来一定是看你怎么用好 AI,把它当作自己真正的个人数字助手,或者真的能帮你干活——就像 Claude Code,能帮你干各种各样的活。但未来具身智能出来的那一天,怎么把你的"脑子"给到那个具身智能的躯体?这非常重要。我现在就在为这件事做准备。

高飞:我对这个观点特别赞同。因为我是个漫画爱好者,《JoJo 的奇妙冒险》里有个设定,每个人都有一个替身,这个替身是精神能量的聚集,有超能力。

我写的公众号就叫"高飞的电子替身"。用"电子"这个词,是考虑到有时候这个替身不一定是数字化的,可能是带身体的。"电子"形容它可能是带身体的,正好和我们今天这个节目契合:未来我们的分身也可能有自己的"住房",这个硬件就是我们分身的住房。

特别感谢李老师,今天收获很大,我们从硬件角度、投资角度,还有李老师为什么对消费硬件感兴趣这件事做了一个很好的梳理。也感谢大家收看这期节目,我们下期再见,拜拜。

李云龙:拜拜。

分享至
0赞

好文章,需要你的鼓励

周雅

Miranda
关注科技创新、技术投资。以文会友,左手硬核科技,右手浪漫主义。
推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-