欢迎光临
我们一直在努力
您的位置:首页>机器人DIY >

为什么AI公司不总是像传统软件初创公司那样规模扩张

从技术上讲,人工智能似乎是软件的未来。人工智能在一系列棘手的计算机科学问题上显示出惊人的进步,并且软件开发人员的工作正在从根本上发生变化,软件开发人员的工作现在与数据一样多,而源代码也是如此。

许多AI公司(和投资者)都押注,这种关系将不仅限于技术领域-AI业务也将类似于传统软件公司。根据我们与AI公司合作的经验,我们不太确定。

我们坚信AI能够推动业务转型:我们将资金投入了这一论点,并且我们将继续对应用AI公司和AI基础设施进行大量投资。但是,我们注意到,在很多情况下,人工智能公司的经济结构与软件业务根本不一样。有时,它们甚至看起来更像传统服务公司。特别是,许多AI公司具有:

由于大量使用云基础架构和持续的人工支持,毛利率降低;

由于边缘案例的棘手问题而带来的扩展挑战;

由于AI模型的商品化和数据网络效应带来的挑战,防御性护城河较弱。

有趣的是,在AI公司的财务数据中我们看到了一个出乎意料的一致模式,毛利率通常在50-60%的范围内-远低于可比SaaS业务的60-80%以上的基准。早期的私人资本可以在短期内掩盖这些效率低下的情况,尤其是在一些投资者推动增长而非盈利的情况下。但是,尚不清楚任何数量的长期产品或投放市场(GTM)优化都可以完全解决问题。

正如SaaS与本地软件相比引入了一种新颖的经济模式一样,我们认为AI正在创造一种本质上新型的业务。因此,本文探讨了AI公司与传统软件公司的不同之处,并就如何解决这些差异分享了一些建议。我们的目标不是规范性的,而是帮助运营商和其他人了解AI的经济和战略前景,以便他们可以建立持久的公司。

软件+服务= AI?

软件(包括SaaS)的魅力在于它可以一次生产并多次出售。该属性可带来许多引人注目的业务收益,包括经常性收入流,高(60-80%+)的毛利率,以及(在相对罕见的情况下,如果网络效应或规模效应得以控制)超线性扩展。软件公司还具有建立强大防御性护城河的潜力,因为它们拥有工作所产生的知识产权(通常是代码)。

服务业占据了另一端。每个新项目都需要专门的人员,并且只能出售一次。结果,收入往往是非经常性的,毛利率较低(30-50%),而且规模充其量是线性的。防御性更具挑战性-通常基于品牌或现有帐户控制-因为客户不拥有的任何IP都不太可能具有广泛的适用性。

人工智能公司越来越多地将软件和服务两者结合在一起。

大多数AI应用程序看起来和感觉都像普通软件。他们依靠常规代码执行诸如与用户交互,管理数据或与其他系统集成之类的任务。但是,应用程序的核心是一组训练有素的数据模型。这些模型解释图像,转录语音,生成自然语言并执行其他复杂任务。维护它们有时会感觉更像是服务业务–需要大量的,针对特定客户的工作和投入成本,而这些成本和成本却超出了典型的支持和成功职能。

这种动态变化以多种重要方式影响着AI业务。在以下各节中,我们将探讨几种毛利,可扩展性和可防御性。

毛利率,第1部分:云基础设施是AI公司的巨大成本,有时甚至是隐藏成本

在内部部署软件的旧时代,交付产品意味着淘汰和运输物理介质-无论是在服务器还是台式机上运行该软件的成本均由买方承担。如今,在SaaS的主导下,该成本已被推回给供应商。大多数软件公司每个月都要支付大量的AWS或Azure账单-软件要求越高,账单就越高。

事实证明,人工智能的要求很高:

训练一个AI模型可能会花费数十万美元(或更多)的计算资源。尽管将其视为一次性成本很诱人,但重新培训已被视为一项持续的成本,因为馈送AI模型的数据倾向于随时间变化(这种现象称为“数据漂移”)。

与运行传统软件相比,模型推断(在生产中生成预测的过程)在计算上也更加复杂。与从数据库中读取数据相比,执行一连串的矩阵乘法只需要更多的数学运算即可。

与传统软件相比,人工智能应用更有可能在图像,音频或视频等富媒体上运行。这些类型的数据消耗的资源比通常的存储资源要多,处理成本高,并且经常会遇到感兴趣的区域问题-应用程序可能需要处理大文件才能找到相关的小片段。

我们已经让AI公司告诉我们,与传统方法相比,云计算操作可能更加复杂且成本更高,特别是因为没有很好的工具可以在全球范围内扩展AI模型。结果,一些AI公司必须定期在云区域之间转移训练有素的模型-花费大量的进出成本-以提高可靠性,延迟和合规性。

总而言之,这些力量贡献了AI公司经常在云资源上花费的收入的25%或更多。在极端情况下,处理特别复杂任务的初创企业实际上发现手动数据处理比执行经过训练的模型便宜。

可以通过专用AI处理器的形式获得帮助,这些AI处理器可以更有效地执行计算,而优化技术(例如模型压缩和交叉编译)可以减少所需的计算数量。

但是尚不清楚效率曲线的形状。在许多问题领域中,需要成倍增长的处理和数据来获得越来越高的准确性。就像我们前面提到的,这意味着模型的复杂性正以惊人的速度增长,并且处理器不太可能跟上。摩尔定律是不够的。(例如,自2012年以来,训练最先进的AI模型所需的计算资源增长了300,000倍,而NVIDIA GPU的晶体管数量仅增长了约4倍!)分布式计算是解决此问题的有力方法,但主要解决速度问题,而不是解决成本问题。

毛利率,第2部分:许多AI应用程序都依赖“循环中的人”来实现高精度

环人系统有两种形式,这两种形式都会导致许多AI初创公司的毛利率降低。

第一:训练当今大多数最先进的AI模型涉及到手动清理和标记大型数据集。这个过程费力,昂贵,并且是更广泛采用AI的最大障碍之一。另外,如上所述,一旦部署了模型,培训就不会结束。为了保持准确性,需要不断捕获,标记新的训练数据,并将其反馈到系统中。尽管诸如漂移检测和主动学习之类的技术可以减轻负担,但轶事数据显示,许多公司在此过程中的支出高达收入的10-15%(通常不计入核心工程资源),并且表明正在进行的开发工作超出了典型的错误修复和功能。补充。

第二:对于许多任务,尤其是那些需要更多认知推理的任务,人类通常会实时插入AI系统。例如,社交媒体公司雇用了数千名人工审核员来增强基于AI的审核系统。许多自动驾驶汽车系统都包括远程操作员,大多数基于AI的医疗设备都与作为联合决策者的医生进行交互。随着越来越多的现代AI系统的功能被理解,越来越多的初创公司正在采用这种方法。计划出售纯软件产品的许多AI公司越来越多地将内部服务功能引入并预定相关成本。

随着AI模型性能的提高,对人工干预的需求可能会下降。但是,不太可能将人类完全淘汰。许多问题(如自动驾驶汽车)过于复杂,以至于无法通过当前的AI技术实现完全自动化。安全,公平和信任的问题也需要人为监督,这一事实很可能已被美国,欧盟和其他国家当前正在制定的AI法规所体现。

即使我们最终实现了某些任务的完全自动化,也尚不清楚由此可以提高多少利润。AI应用程序的基本功能是处理输入数据流并生成相关的预测。因此,操作系统的成本是所处理数据量的函数。一些数据点由人工处理(相对昂贵),而其他数据点则由AI模型自动处理(希望更便宜)。但是每个输入都需要以一种或另一种方式进行处理。

因此,到目前为止,我们已经讨论了两类成本,即云计算和人工支持。减少一个往往会导致另一个增加。这两个方程式都可以优化,但是没有一个可能达到与SaaS业务相关的接近零的成本水平。

扩展AI系统可能比预期的要困难得多,因为AI寿命长

对于AI公司而言,知道何时找到适合市场的产品比传统软件要难得多。容易想到您已经到达那里了-尤其是在关闭5-10个伟大的客户之后-只是看到ML团队的积压开始膨胀,并且客户部署计划开始不受欢迎,从而从新销售中提取资源。

在许多情况下,罪魁祸首是极端情况。许多AI应用程序都有开放式界面,并且可以处理嘈杂的非结构化数据(例如图像或自然语言)。用户通常对产品缺乏直觉,或更糟糕的是,假定产品具有人类/超人类的能力。这意味着边缘情况无处不在:我们研究的AI产品预期功能的多达40-50%可以驻留在用户意图的长尾中。

换句话说,用户可以并将将几乎所有内容输入AI应用程序。

处理这个巨大的状态空间往往是一件繁琐的事情。由于可能的输入值范围很大,因此每个新客户部署都可能生成从未见过的数据。即使是外观相似的客户(例如,两家汽车制造商都在进行缺陷检测)也可能需要实质上不同的培训数据,这是因为将视频摄像机放置在装配线上很简单。

一位创始人称这种现象为AI产品的“时间成本”。她的公司在每个新的客户参与开始时都会进行专门的数据收集和模型微调。这使他们可以查看客户数据的分布,并消除了部署前的一些极端情况。但这还带来了成本:公司的团队和财务资源被捆绑在一起,直到模型准确性达到可接受的水平。培训期的持续时间通常也是未知的,因为通常没有什么选择可以更快地生成培训数据……无论团队如何努力。

人工智能初创公司通常最终会花费比预期更多的时间和资源来部署其产品。提前识别这些需求可能很困难,因为传统的原型设计工具(例如模型,原型或Beta测试)往往只覆盖最常见的路径,而不能涵盖边缘情况。与传统软件一样,在最早的客户群中,该过程特别耗时,但是与传统软件不同,该过程不一定会随着时间的流逝而消失。

捍卫AI业务的剧本仍在撰写中

伟大的软件公司围绕强大的防御mo堡而建。最好的护城河是强大的力量,例如网络效应,高交换成本和规模经济。

所有这些因素对于AI公司也是可能的。防御的基础通常是由技术上优越的产品构成的,尤其是在企业中。作为第一个实施复杂软件的人,可以带来主要的品牌优势和几乎排他的时期。

在AI世界中,很难实现技术差异化。新的模型架构主要是在开放的学术环境中开发的。可以从开源库中获得参考实现(预训练的模型),并且可以自动优化模型参数。数据是AI系统的核心,但通常由客户拥有,在公共领域或随着时间的流逝成为商品。随着市场的成熟,其价值也逐渐下降,并且网络效应相对较弱。在某些情况下,我们甚至发现与数据馈送AI业务相关的规模不经济。随着模型变得更加成熟–如“数据护城河的空洞承诺”所述” –每个新的边缘案例的解决成本都越来越高,同时为越来越少的相关客户提供价值。

这并不一定意味着AI产品的防御性要比其纯软件产品低。但是,对于人工智能公司而言,护城河似乎比许多人预期的要浅。从防御性的角度来看,人工智能可能是通向底层产品和数据的通道。

建立,扩展和捍卫优秀的AI公司-创始人的实用建议

我们认为,人工智能公司要取得长期成功,关键是要应对挑战,并充分利用服务和软件的优势。秉承这种精神,创始人可以采取许多步骤来使新的或现有的AI应用程序蓬勃发展。

尽可能消除模型复杂性。我们已经看到,在每位客户训练一个唯一模型的初创公司与能够在所有客户之间共享一个模型(或一组模型)的初创公司之间,COGS存在巨大差异。“单一模型”策略更易于维护,更快地推向新客户,并支持更简单,更高效的工程组织。它还趋向于减少数据流水线的蔓延和重复的培训运行,从而可以显着提高云基础架构的成本。虽然没有银弹达到这种理想状态,一个关键是要尽可能多地了解你的客户-他们的数据-前同意交易。有时候,很明显,新客户会为您的ML工程工作带来巨大的负担。在大多数情况下,更改会更加细微,仅涉及少数几个独特的模型或进行一些微调。做出这些判断(权衡长期经济健康与近期增长)是AI创始人面临的最重要工作之一。

仔细选择问题域(通常是狭窄范围),以降低数据复杂性。从根本上说,使人工劳动自动化是一件很难的事。许多公司发现AI模型的最低可行任务比他们预期的要窄。例如,有些团队没有提供一般的文本建议,而是发现在电子邮件或职位发布中提供简短的建议很成功。CRM领域的公司已经发现,基于更新记录,可以为AI找到非常有价值的壁highly。像这样的大类问题,人类很难执行,而AI则相对容易。它们往往涉及大规模,低复杂度的任务,例如审核,数据输入/编码,转录等。专注于这些领域可以最大程度地减少持久性边缘情况带来的挑战,换句话说,它们可以简化数据输入。人工智能开发过程。

计划高可变成本。作为创始人,您应该为您的业务模型提供可靠,直观的思维框架。这篇文章中讨论的成本可能会提高-降低一定的幅度-但假定成本将完全消失(或强迫其不自然)是错误的。相反,我们建议在考虑较低毛利率的情况下建立业务模型和GTM战略。创始人的一些好的建议:深刻理解为模型提供数据的分布。将模型维护和人员故障转移视为首要问题。跟踪并衡量您的实际可变成本–不要让它们隐藏在研发中。在您的财务模型中做出保守的单位经济假设,尤其是在筹款期间。不要等待规模扩大或外部技术进步来解决问题。

拥抱服务。有巨大的机会来满足它所处的市场。这可能意味着要提供全栈翻译服务而不是翻译软件,或者提供出租车服务而不是出售自动驾驶汽车。建立混合业务比纯软件更难,但是这种方法可以提供对客户需求的深刻洞察,并产生快速发展的,定义市场的公司。服务也可以成为启动公司进入市场引擎的绝佳工具-有关此事的更多信息,请参阅这篇文章-特别是在销售复杂和/或全新技术时。关键是要以一种坚定的方式追求一种策略,而不是同时支持软件和服务客户​​。

计划技术堆栈中的更改。现代AI仍处于起步阶段。刚刚正在构建可帮助从业人员以高效和标准化的方式完成工作的工具。在接下来的几年中,我们希望看到工具的广泛使用,以使模型训练自动化,提高推理效率,标准化开发人员工作流以及监视和保护生产中的AI模型。通常,云计算作为软件公司要解决的成本问题也越来越受到关注。将应用程序紧密耦合到当前的工作方式可能会在将来导致体系结构上的劣势。

用老式的方法建立防御力。虽然尚不清楚AI模型本身或基础数据是否会提供长期的保护,但好的产品和专有数据几乎总能建立良好的业务。人工智能为创始人提供了解决旧问题的新视角。例如,人工智能技术通过简单地表现出更好的性能,在相对困倦的恶意软件检测市场中已经产生了新的价值。在最初的独特产品功能之上构建粘性产品和持久业务的机会是永恒的。有趣的是,我们还发现有几家AI公司通过有效的云战略来巩固其市场地位,这与最新一代的开源公司类似。

* * *

总结一下:从传统意义上讲,当今大多数AI系统都不是完全软件。结果,人工智能业务看起来并不完全像软件业务。它们涉及持续的人力支持和重大可变成本。他们通常没有我们想要的那么容易扩展。强大的防御能力(​​对于“一次制造/多次出售”软件模型至关重要)似乎并非免费提供。

这些特征在某种程度上使AI感觉像服务业。换句话说,您可以更换服务公司,但不能(完全)更换服务。

信不信由你,这可能是个好消息。可变成本,缩放动态和防御性护城河之类的事物最终由市场而不是单个公司决定。我们看到的数据不熟悉的事实表明,人工智能公司确实是新事物-进入新市场并创造大量机会。已经有许多伟大的AI公司成功地克服了迷宫般的想法,并制造出性能始终如一的产品。

人工智能仍处于从研究主题到生产技术的过渡的早期阶段。很容易忘记,可以说引发了当前AI软件开发浪潮的AlexNet不到八年前就发布了。智能应用程序正在推动软件行业向前发展,我们很高兴看到它们的下一步发展。

资料来源:传统软件的毛利率估计是基于publiccomps.com上列出的一些公司得出的;服务公司的毛利率估算基于1万份申报;人工智能业务的毛利率估算基于对人工智能初创公司创始人的几次采访。

免责声明:本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。