[前言] 技术创新要通过赋能千行百业而体现,更需要无数创业者以新思路来呈现。GSMA 5G创新与投资平台(5G IN)推出「创业者说」系列访谈,携手新媒体平台科技行者,分享创业者的创新故事。
想象2025年的某一天,当你头戴一副酷炫轻薄的MR(混合现实)眼镜走在路上,唰,空中飘起一张麦当劳打折券,你用手轻触这张虚拟券,地面立刻出现了导航条,于是你沿着导航条一边走,一边让MR眼镜里的虚拟助手,为你下单并支付,走到麦当劳就可以享用。
这是全景电商的一个小设想。从电商、游戏娱乐、安防、早教、医疗到各种工业制造,视频技术无处不在,而让视频技术融合5G、AI等技术,再能够沉浸到更多行业应用场景,则是像网达软件这样的公司正在做的事情。
在网达软件公司官网,有一句话定位自己:“以视频智能化为核心的软件产品及解决方案提供商”。网达软件副总经理张悦近期接受科技行者专访,张悦强调,网达公司成立已经有18年,立足于最早的通信运营商和设备商的合作基础,网达最强大的能力就是视频方面的编解码能力,由于市场带宽利用率高,而完成窄带高清的实际场景是网达的能力根本。
张悦举例,我们把5G看成是具备多层算力分布的一个高速网络。用人类身体来类比的话,5G网络就是密布人体的反应迅速的神经系统,云计算中心就是算力最充分的大脑,脊椎神经元就是分布式边缘计算单元,而高效准确的视频采集就是人眼——人类80%的信息摄入是通过视觉进行的。而承载视觉信息的视频媒介,正是网达软件公司的主流业务领域。
图:网达软件副总经理张悦
科技行者:网达软件的业绩在 2020 年实现了大幅预增,请问增长来自哪些方面?
张悦:由于2019年5G+高清视频行业需求猛增,包括网达原有客户在内的市场都出现很多新的刚需,网达软件也因此受惠并发展扩大了业绩。实际来看,目前高清视频还仅仅停留在娱乐业务层面,高清教育、高清人工智能摄像、XR、数字内容商业化等更广阔的市场爆发还远远没有来临,网达软件立足于整体视频解决方案的提供,上述场景带来的市场业绩和增长不久后都会更快地体现出来。
科技行者:总的来看,疫情对视频行业带来了哪些影响?哪些场景正在迅速发展?
张悦:2019 年底爆发的世界范围的新型冠状病毒疫情以来,对视频行业的影响是巨大的,总体来讲对行业是利大于弊的。由于世界范围内疫情防控的需要,线上活动大大加强, 一些场景刚性需求猛烈:视频会议、线上 XR 虚拟展会、现场温测监控等视频需求非常火爆;同时,AI 也介入其中,解决非接触的现场服务和沟通,比如:酒店大堂机器人、人流密度控制智能摄像头、展厅虚拟人服务等等。
科技行者:5G 被认为是未来十年的通用型技术,5G 为网络视频行业带来了哪些机遇?
张悦:我们把5G看成是具备多层算力分布的一个高速网络。用人类的身体来类比的话,5G网络就是密布人体的反应迅速的神经系统,云计算中心就是算力最充分的大脑,脊椎神经元就是分布式边缘计算单元,而高效准确的视频采集就是人的眼睛,而人类80%的信息摄入是通过视觉进行的。
我从小训练踢足球,这是我个人坚持了 30 年的一项体育运动。我记得最早接触该运动的时候,教练培训我要看着球的运动轨迹,然后用脑子控制身体的脚部位置,注意击球点把足球踢向我想要它飞行而往的地方。经过不断训练,很快我就把这些观察、思考、行动熟练并飞快的变成了所谓的“肌肉记忆”,其实这就是很典型的 5G+AI,用 AI 把冷数据训练成热数据后,为了提高响应效率,必然需要把优化后的算法下沉到边缘计算中心,我一直认为人类是最优秀的 AI。
视频业务和AI业务真正具备了让网络上下行带宽都用足。我们5G以前的网络使用是不对称的,无论是计算机时代的键鼠交互,还是智能手机时代的滑屏交互,其交互的上线数据量是不足够的,所以以前的网络上行数据都只有几K、几兆、几十兆,但随着摄像头技术的不断进步,高清摄像头、双摄视觉差摄像头、激光摄像头、红外雷达摄像头的不断更新,视频采集端的数据量就飞速发展起来了。这些数据要么在算力端侧计算完成, 要么通过上传到云中心来计算完成,然后再下传到终端侧来展现。
可见,视频业务作为通信业务的展现层是最为直观在应用上的。XR业务的本质还是基于AI交互的多维高清视频业务,XR终端是下一代计算平台,该平台必须跑在云端联动的5G以上网络上。
科技行者:网达既有面向大屏的解决方案,又有面向手机视频的方案,不同的屏幕尺寸,有哪些不同的技术诉求差别?
张悦:这两类方案,虽然都属于视频产品,但在用户群体、使用场景、操作方式、内容类型、运营方式、互动方式都存在着显著的差异,都需要具备长时间的技术积累和研发才能更好地满足市场需求。
由于内容牌照的管控不同,技术方面在端侧开发与适配、高并发服务端侧部署、系统安全方面存在差异。在业务展现侧,“多屏互动”业务恰恰是表现出了网达在大小屏上的超强能力,让客户在有屏的地方,就可以顺利的体验各种视频高清;同时,在技术层,网达公司实际成立已经有 18 年了,立足于最早的通信运营商和设备商的合作基础,网达最强大的能力就是视频方面的编解码能力,带宽利用率高,完成窄带高清的实际场景是网达的能力根本。
最终,客户在观看或者使用大小屏场景中明显会觉得体验是“不卡,流畅,清晰”。很快,网达也会把自有的编解码能力和多终端业务融合能力用在 XR 上,用在 AI 摄像监控上,让各种终端内的视频体验,能更加快速,更加聪明,更加清晰。
科技行者:网达还有电商行业的解决方案,请您介绍电商行业对视频行业的主要需求点在哪里? 网达的方案优势又在哪里?
张悦:传统电商SKU仍在持续增加,而传统移动终端受限于二维界面和传统4G网络带宽限制,造成的信息展示和获取的不对称。电商行业呼唤更加高清和互动性更好的直播和购物体验。
以网达软件在推的全景电商整体解决方案为例,其体验式消费能够极大刺激消费者的购买欲望,对正在探索新的发展模式的传统电商来说,也是一个极具吸引力的发展方向。全景电商则是在纯互联网电商的基础向上延伸,仍旧是传统电商模式的延续, 提升的是标准商品的服务价值。全景电商与“互联网+”的结合,能够完全逆转传统电商行业的颓废之势, 使电商行业朝体验式消费进化。
个人认为这个就是无处不在、交互式的商业游戏化。请大家想象,在2025 年的一天, 你头戴一副酷炫轻薄的 MR 眼镜走在路上,原本空无一物的街道因为你的到来,出现了众多漫威英雄,钢铁侠和你对射激光;空中飘起一张麦当劳打折券,你用手轻触这张虚拟券,地面上立刻出现了导航条,于是你沿着导航条一边走,一边让 MR 眼镜里的虚拟助手,为你定了牛肉套餐并支付完毕;走到麦当劳,拿到了热腾腾的套餐,你便在餐厅找了个安静的角落坐了下,等待再过半小时就要开始的远程可视 MR 会议...
网达软件就在 5G 商业游戏化的道路上快速前进着。数字化的内容展现,是网达在下一代电商业务的点,而我们具备的很大优势就是交互性、低时延和沉浸性。
科技行者:科技公司的关键是技术,如何保证技术人才的持续供应和成长?
张悦:2015年,张一鸣曾经有这么一条简短的微博:Develop a company as a product。创业者在启动创业的时候,其实同时在做两个产品。一个是提供给用户的产品,另一个是提供给员工的产品,就是公司本身。
而公司的管理者就是这两个产品的产品经理,他负责链接两端,一端是业务,一端是员工。有的人可能会有疑问,公司给员工发工资、发奖金,员工怎么可能是公司的客户?其实,在经济学原理下,“员工为公司贡献生产要素,公司向员工支付工资和奖金”,这件事情和“公司向客户提供产品和服务, 客户向公司支付商品和服务费用”在本质上几乎是一样的,都是双方利益最大化下进行的等价交换。
“利益最大化”是我们做一切决策的关键指标,这里我们引入经济学上的 一个概念——ROI(Return on Investment)来帮助我们理解。ROI,一般翻译为“投资回报率”,指代我们从一项投资中可以获得的总经济回报。很多企业把人当成企业的损耗成本,特别是有些 CEO 很节约,总想招一些便宜的人。但这种观念在经济学上显然是错的。
这个人虽然很便宜,但是能给你带来的回报很少,或者说低于你付给他的工资,那么这个人给你带来的 ROI 就是负数。这个人虽然很贵,但是给你带来的回报更大,说不定这个人才是真正便宜的。
对于员工来说也是一样,他为什么愿意加入你的公司,因为加入你的公司,个人投资回报率最大。而对于 CEO 来说,如何设计好“公司”这个产品,就是让公司和员工同时拥有最高的 ROI,让彼此对投资回报率感到满意。
那么,公司和员工的 ROI 到底由哪些因素决定?我列出了以下这个公式:ROI=(功能性回报+心理性回报)/(功能性投入+心理性 投入),它的大小主要由 4 个元素来决定,分别是公式的分母端的功能性投入(投入的时间、金钱),加上心理性投入(内心疲惫、精神焦虑);分子端的功能性回报(长短期收入),加上心理性回报(开心、成就感、成长)。
而如果要让 ROI 最大化,其实网达要做的只有两件事,降低分母,提高分子。很简单,我把网达的人才机制拆解为 3 点:
· 第一,回报。包括长短期的经济回报;
· 第二,成长。在这个平台能获得多少成长。
· 第三,心情。和团队、领导能否愉快共事,通勤成本是否影响心情等等。
另一方面,如何减少公司的总投入?网达也给出了招人的 3 个标准:
1、超强学习能力;2、视野开阔;3、心智成熟。
我们要招的是市场上最顶级的人,这些人必须要用市场最高的薪酬水平来获取,包括给到员工的工资、奖金和期权,成本相对来说都是很高的。但与此同时,我们发现这样的人招进来之后:
1、公司管理的成本降低了。优秀的员工一说就灵,而且学习能力很快,公司花在每个员工身上的培训时间和金钱降低了;
2、领导花在员工上的心理性投入也降低了,大家目标清晰、各司其职,都不掉链子,也不用担心员工受不了压力玻璃心,我们心理性的投入就会大大减少。
回头来看,超强学习能力、视野开阔、心智成熟,网达是通过这 3 个关键特质,精准地打中了除金钱之外的所有要素上的成本降低,来有效维持公司总投入。
但 2021 年开始,网达会加大和高等学府的产学研一体的项目培育和人才寻找,并充分给与团队和项目的发展自主权。每一个社会、国家、组织、企业都会有熵增出现,作为每一个组织的管理者而言,制定好明确战略、制定好高效管理,以人为本、 以终为始,管理者平衡好每一个个人的马斯洛三层需求,人才是一定济济一堂的。
反过来,每一位有才能的员工也要知道,打过仗吃过苦的人才更知道何为个人的成功。爱因斯坦有句话,“Information is not knowledge,experience is”,经历了才真正拥有知识,中国古代也提倡“学以致用”方能立足于天下。网达软件,给有才有识有志的人精彩的天下! “网”以致用,通“达”天下!
科技行者:请对中国网络视频行业未来一年的发展,做一些预测。
?张悦:网络视频超高清化是一年内趋势。超高清视频产业主要包括超高清视频的采集、编辑、传输、呈现的主要环节,具有产业链条长、辐射范围广、带动效应强等特点。
在采集摄录方面,高分辨率、高动态范围、三维立体、快速变焦等成为重要发展机遇。4K/8K 分辨率、50/60/120 帧、HDR 高动态以及高色深成为视频采集摄像机技术的需求,目前我国广电级高端摄像机主要依赖国外,如索尼、松下等日本品牌,而我国卓曜、华创科技、尊正、扳手科技等企业已初步具备超高清专业摄像机自主设计和制造能力,并推出 4K 影视节目摄像机、4K 电影摄像机等产业化产品,演播室系统已初 步具备竞争力,但国内缺乏视觉特效与合成、图像处理等基础底层核心算法,并且在 CMOS 芯片、光学镜头、DRAM、Flash 存储等方面仍落后日韩企业。
在编辑处理方面,端云协同、人工智能、视频处理等基础算法成为未来机遇。非线性编辑、后期渲染、特效等是视频后期的主要环节,在特效电影、CG 动画等对图像渲染 的要求越来越高的情况下,云媒体制作成为重要手段之一,如《流浪地球》即使用云服务进行渲染工作。目前,超高清视频后期制作成本高、产出小,尽管很多影视采用 4K 拍摄,但只制作输出高清版本,因此在当前 4K 内容不足的情况下,利用人工智能算法实现空间上超分辨率、时间上插帧成为重要解决方式。
在传播输出方面,编解码方式和 5G、千兆固网宽带等网络传输方式成为关注焦点。编解码方面,H.265、AVS 2成为超高清视频编解码的主要选择,H.265(HEVC)可以在维持画质基本不变的前提下,让数据传输宽带减少至H.264的一半,支持最高为7680*4320的分辨率,H.265 还具有可变量的尺寸转换(从4x4到32x32)、四叉树结构的预测区域(从 64x64 到 4x4)、多种帧内预测模式、精准的运动补偿滤波器等特性, AVS 2由我国数字音频解码技术标准工作组制定,性能与 HEVC 相当,成为我国自主的编解码标准;网络传输方面,有线电视、IPTV、卫星广播、地面广播是网络传输的主 要方式,使用H.265或与之相当的编码方式,在保证超高清视频体验的前提下,4K码流大概为 30~50Mbps,8K码流大概为100~150Mbps。在我国,IPTV和有线电视成为主要网络传输方式,我国光纤宽带和蜂窝网络覆盖全球领先,广电获得5G牌照,未来5G有望成为超高清视频网络传输的新选择。
在终端呈现方面,高分辨率、HDR、智能用户交、沉浸式成为发展趋势。目前 4K 电视已经成为主流,中国市场 60%以上已是4K分辨率,而 8K 电视仍以展示为主。显示面板方面,高对比度、高色深、高色域、高刷新率成为关键性指标。良好的 HDR 体验要将面板的对比度提升至 10000:1 及以上,LCD面板达到 1000尼特峰值亮度,但我国市面上大部分电视仅仅能够达到400尼特左右。
主控芯片方面,更高的编解码能力和人工智能成为未来的发展方向。CPU、GPU、编解码芯片、数据接口将均集成于电视机、 机顶盒 SoC 芯片内,基于未来语音、图像的智能交互,神经网络等人工智能算法将从芯片层面给予支持。专用图像处理芯片方面,由于对画面的处理能力要求更高,色彩控制、锐度处理等图像处理功能将更多采用独立的图像处理芯片,如索尼、三星等, 我国电视的画质处理更多以软件方式实现。至于XR的头戴式近眼显示器,我认为还需要 2-3 年来发展,C端产品对用户体验感要求是极高的,而XR用户良好体验感背后的科技含量是最为挑战科技界的,低功耗、低延时、准定位、交互好、沉浸式这些要素的实现还需要一段时间,但无论如何,下一代个人计算平台一定是XR 头戴式高清显示设备。
在业务侧,我很看好除娱乐外的行业高清视频类应用,比如:人工智能支持的高清摄像头,用来完成安防、防疫、流控、车辆等等社区或者公开场所的各种场景。
科技行者:接下来的一年,网达的业务重点和工作方向是什么?
张悦:首先,虽然是 A 股主板上市公司,网达软件从来把自身定位成创业公司,永远要处于创业的思想逻辑中、经营理念中。所以网达软件新的一年定的业务主要方向是:
1、 高清视频产业;2、 5G+AI+边缘计算。
高清视频方面,网达将在两个业务方面发力:编辑处理方面,端云协同、视频处理等基础算法和 H.265、AVS 2 超高清视频编解码。今年网达会推出自有品牌的网达SaaS云,服务于各行各业在视频编辑、视频运营、内容安全服务等方面。5G+AI+边缘计算方面,网达将推出自己品牌的硬件产品,高清智能摄像头和边缘计算盒子,在软硬件一体的研发、算法的研发和业务场景的开发上加速加快进行,目标就是世界范围内的客户和市场。
为了达成上面两个战略业务目标,网达将在相关“人”、“事”、“物”上做好相关工作。
“人”就是:配备人员,宁缺毋滥,寻找最优秀的技术和BD团队,其中网达今年将成立专业的市场部门,把公司独立品牌建设好,把品宣做好,把国际化做起来。网达会采用更积极的方式来促进项目和人才的成长,比如说上市公司内部孵化项目后再独立运作的道路,让每一个有能力的员工看得远、走出去、跳进河、爬上岸、 立天下。
“事”就是:抓住战略项目,以去年年底刚中标的几个云能力项目和海外的 AI 智能终端项目为契机,全员动员,加速公司能力产品化,从卖开发、到卖服务、再到卖能力,最后和我们的客户共享价值。
“物”就是:对所有物料财务准备工作的执行。今年,网达在 A 股市场上有定向增发的计划,目前也已经获得了很多青睐网达未来的投资机构的战略性投资标的。同时,今年元旦网达在合肥的产学研大楼也已经结构封顶了,未来网达也会获得更多上海、浙江、安徽相关政府的产业扶持。今年,网达也会公司内部推行积极的薪资革新和激励,我相信无论来自于哪里的网达人,都会对2021年充满斗志、信心、 目标和希望。
好文章,需要你的鼓励
作为中美连续创业者,赵维奇的创业之路非常宽泛,做过社交软件、做过游戏、做过面向极限运动的AR产品等。而现在,赵维奇作为Rokid全球开发者生态负责人,也参与负责Rokid多款软硬件产品设计与研发。他回忆说,最早加入Rokid是在实验室,开发Rokid第一代AR眼镜,相当于是一个小组在做内部创业的过程。