当下,众多企业与组织都在努力紧跟大数据发展趋势,但其中的挑战也相当严峻。单单是管理规模庞大的数据集已经颇为艰难,更遑论从中提取出有意义洞见并借此建立竞争优势。
这种对大数据管理能力的实际需求,推动又一波初创企业投身其中,开发下一代数据库软件与数据管理工具。
1、Ahana
联合创始人兼CEO:Steven Mih
总部:美国加州圣马特奥
Presto最初由Faebook公司开发完成,用于查询该公司PB级数据仓库中的数据资产。2013年,Facebook决定将Presto转化为开源项目。
Ahana公司最近告别隐身模式,开始围绕PrestoDB(基于Presto技术的另一个开源项目)开发即席分析软件。今年6月初,该公司表示已经从GV(前Google Ventures)牵头的融资中筹集到225万美元种子资金,这笔款项将主要用于扩大技术团队规模并加快开发工作。
2、Aparavi
CEO:Adrian Knapp
总部:加利福尼亚州圣莫尼卡
文件备份与数据保护方案供应商Aparavi公司于今年3月推出了其首款数据智能与自动化平台,据称该系统将帮助企业高效应对分布式IT世界所带来的数据混乱、风险与识别发展机遇等难题。
该系统还包含适用于分布式数据的分析、机器学习及协作工具,可帮助用户将数据资产切实转化为竞争优势。
3、Cockroach Labs
联合创始人兼CEO:Spencer Kimball
总部:美国纽约
2019年10月,这家初创企业又发布了CockroachCloud,即该数据库的全托管分布式版本。
今年5月,该公司在新一轮融资中筹得8660万美元,历史融资总额则达到1.951亿美元。
4、Equalum
总部:美国加州桑尼维尔
Equalum公司表示其技术拥有“无限的速度与可扩展性空间”,用户无需任何编程经验即可开发出数据管道。
5、Okera
总部:美国旧金山
Okera公司开发出一套平台,供IT管理员自动发现并标记各类敏感数据、制定并执行数据治理策略,并对数据安全性与治理操作进行审计。
今年4月,Okera公司在B轮融资中筹得1500万美元,这也使其历史融资总额增长至2960万美元。这笔款项将主要用于扩大内部工程技术、销售与市场营销团队。该公司还任命了ZoomData前任总裁兼CEO Nick Halsey出任新的CEO。
6、PlanetScale
总部:美国加州山景城
该公司的这套PlanetScaleDB Cloud是一种全托管、多云架构且具备MySQL兼容性的数据库即服务。对于希望自主运行数据库即服务体系的客户,他们还准备了PlanetScaleDB Enterprise。
今年6月,该公司推出PlanetScaleDB for Kubernetes,用于将数据库直接部署至Kubernetes集群当中。
7、Promethium
CEO:Kaycee Lai
总部:加利福尼亚州门洛帕克
”Promethium公司在今年1月筹得600万美元风险资金。
8、Rivery
联合创始人兼CEO:Itamar Ben Hemo
总部:美国纽约
、并加载至云端分析系统(例如Amazon Redshift、Google BigQuery以及Snowflake)当中的整个流程。Rivery公司于2019年11月获得500万美元的种子轮投资。
9、Starburst
总部:美国波士顿
凭借着直接访问数据驻留位置以及无需移动即可直接查询等强大功能,Starburst软件已经成为传统数据仓库系统的一种良好替代方案。
今年6月,Starburst公司在B轮融资中筹得4200万美元。在2019年11月的A轮融资中,他们也筹得2200万美元。
10、Theia
总部:加拿大安大略省渥太华
。该系统还提供一份完善的分析功能目录,涵盖数据发现与治理、搜索、个性化、以及面向客户进行信息发布的外部门户等功能选项。
研究企业Gartner最近将Theia公司评为“Cool Vendor”。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。