任何新事物的开花结果,都要经历一个被检验的过程,才能被正确评判,并在历史舞台刻下烙印。万事万物中,技术(Technology)可能是相对比较难评判的一种。
凯文·凯利曾设想,技术某种程度上更超越了事物,更接近于生命形态,因为技术就像生命一样不断演化,充满不确定性。如果真是这样,也就难怪人们在涉及对技术的检验、判断和预言上,经常犯大错误。
比如,我们会低估一项技术。IBM创始人托马斯·沃森在1943年断言,“全球只需5台计算机”就够了,因为他不觉得有多少人需要计算机协助工作和学习。再比如2007年,面对iPhone的触摸界面,诺基亚也认为这技术没什么大不了,因为自己的5800MX音乐手机,和随后的N97也不错。但事实证明,他们远远低估了个人计算机和智能手机两大技术产品的价值。这种误判,还在持续发生着。
今年3月,国家加大了对新基建的推广。新基建,是由信息技术、通讯技术支撑的基础设施平台,这其中包括了以5G、物联网、工业互联网、卫星互联网为代表的通信网络基础设施,以人工智能、云计算、区块链等为代表的新技术基础设施,和以数据中心、智能计算中心为代表的则是算力基础设施等。
在以上涉及的技术中,区块链,是“年纪”最小的技术,但它也是最可能被误判的技术,围绕这项技术进行的争论非常之多。有人“高估”它,认为它具备革命性,是史无前例的,能改变 “生产关系”的技术;但有更多人“低估”它,认为区块链没有创造任何价值,只是无意义的消耗算力,“看不到实际用途”。
也是从3月份开始,为了解区块链技术真实的状态,“科技行者”启动了《区块链启示录》项目,持续约访了十几位区块链一线从业者进行深度交流。一番访谈之后,我们得出这样一个结论,对区块链这项既被高估,又被低估的技术,被低估的程度要更大一些。区块链并非可以一念生天的灵丹妙药,但是它绝不是只能消耗算力的“空中楼阁”。
因为,认为区块链“不堪实用”的低估者或许忘了,在新基建涉及的已知技术中,区块链可能是唯一一个完全从一项真实应用中脱胎而出的技术。中本聪2008年发布白皮书《Bitcoin: A Peer-to-Peer Electronic Cash System》,并在之后计算出第一个区块时,区块链就作为bitcoin的支撑技术进入了实际应用。区块链,“生于应用”。
现在,围绕区块链后续发展出现的种种低估,甚至不屑,其实不是区块链不可应用,反而是区块链和“原生应用”结合太深,难以解藕造成的。但是,这次我们通过与从业者的交流,发现,“解藕”的过程正在加速,甚至疫情也没有阻挡脚步。
在金融、凭证、制造、流通等领域,区块链正以无可比拟的优势,在企业端逐渐枝繁叶茂。同时,在区块链的落地过程中,国内区块链从业者的技术、能力和专利储备,即使放在全球视角去比较,也称得上位居前列。
在读过本期《区块链启示录》之后,相信大家会得出和我们一样的判断——区块链,因应用而生,也正在繁荣于应用。
好文章,需要你的鼓励
这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。
上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。
上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。
字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。