编辑简介:现在平台产品不再是一个新概念AI技术成熟,AI平台产品越来越多。那为什么要做呢?AI平台?这些AI平台有哪些类别?让我们跟随作者,一起探索。
有一天,小李的领导说:我们必须这AI平台!”。
虽然平台产品不是新概念,但随着AI技术成熟,AI平台产品越来越多,但仅仅做平台一句话,小李还是犯了很多困难——大大小小的平台。我们应该做什么?AI平台呢?磨刀不误砍柴,小李决定先研究市场上现有的。AI平台寻找灵感。
AI平台大致可以分为AI开发平台和AI支类支撑平台(名字是小李瞎起的)。
AI开发平台面向模型开发者,围绕AI提供模型/算法生命周期(数据收集、标记、模型结构设计、模型训练、模型部署等)的工具。开发平台产品需要更好地积累算法开发过程和算法类型的丰富性,因此大多数平台产品都是由内部技能较深的大型工厂推出的。
(百度BML功能架构)
1)用户
都叫开发平台,用户必须是开发人员,使用AI开发平台的研发人员对人工智能有不同的理解。他们可能是业务应用程序的开发人员(只需调用模型API),也可能是AI但归根结底,工程师(需要调整模型参数,甚至重新设计网络结构)AI开发平台是面向开发人员的B端产品。
2)场景
在需要AI当用户可以使用能力支持时AI不同层次的工具/功能(嵌入级,API实现所需的级别、数据培训级别、模型定制级别、算法开发级别)AI能力。
3)解决问题
AI赋能其他产品。
3)解决问题
AI赋能其他产品。AI作为一种产品,平台的核心问题是如何方便其他应用程序或产品获得智能化。看到很多强调AI平台是为了让AI算法开发更简单,但归根结底,如果不需要其他产品AI模型或者AI能力,自然不需要算法开发,更不用说所谓的了AI存在开发平台。
AI大多数支持平台面向运营商/业务人员AI可以提供应用程序work配置、管理等支持功能。智能对话平台是一个非常典型的平台AI支持平台,因为智能对话应用程序不仅仅依赖于某个模型,所以需要根据业务场景进行技能管理和对话设置。智能对话平台是这些配置功能的载体。
1)用户
主要是业务人员或运营商,即需要设置应用程序的具体规则和内容的工作人员。
2)场景
在使用某个智能应用时,用户需要根据实际业务场景对应用中的某些功能进行配置,才能使应用按照需求运行起来。
3)解决问题
按照用户的期望运行智能应用。那为什么这些应用需要配置呢?为什么不能固化?由于应用程序的使用场景非常不同,如银行的智能客户服务和购物中心的智能客户服务。虽然底层的技术方法是一致的,但具体的客户服务面临着完全不同的问题。
从产品角度看,为了使产品的通用性更强,我们往往会设计一个通用的应用框架,然后把高频且重要的功能做成可配置项以适应更多用户的需求。这并不意味着不能固化功能,但在这种情况下,产品已经成为一个定制的项目,成本非常高,无法重用。
(AI开发&支撑平台对比)
知乎看到了一个更好的平台产品定义:平台产品提供高度普遍的工具,连接多端多角色之间的活动或交易。AI开发平台产品也是如此。AI为不同层次的开发者提供模型/算法生命周期的工具AI模型设计、训练、使用等活动。
AI模型的生命周期大概是这样的:
AI即使是开发平台也服务于AI模型生命周期的工具自然离不开上述模块。所谓平台,只能针对某个环节,比如数据收集 标记链接,或模型部署链接,也可以针对整个生命周期,这解释了为什么它们都是一样的AI有大有小的平台。
如果我们从AI从模型生命周期的角度来看,有:
1)数据标注平台
与培训数据相关的工作,如数据接入、清洁、标记等。事实上,数据访问和清理与大数据有很强的相关性,一些标记平台甚至大数据系统的组件。
对于AI对于标注/数据平台,一个想法与百度相似EasyData,为模型训练数据提供一些预处理功能(如缩放、翻转图像以提高模型的鲁棒性,或过滤图像、降噪等增强操作)和智能标记功能(先使用训练好的模型自动标记,然后手动校准或微调),正是这些功能支持数据标记平台。
另外一个不错的思路是更侧重“标注”这个动作本身,类似basicFinder,做数据需求方和数据标注商的匹配业务,并提供标注工具。
另外一个不错的思路是更侧重“标注”这个动作本身,类似basicFinder,做数据需求方和数据标注商的匹配业务,并提供标注工具。
2)模型设计平台
这通常不是单独的产品。个人猜测的主要原因是模型结构设计门槛高,需求小。从我自己的经验来看,开源框架开发和使用平台提供的工具效率差别不大。
通过可视化拖拉,模型设计的功能大多是作为开发平台的模块notebook模型结构设计等。
腾讯车联:那些跨界老板对汽车做了什么?腾讯篇
3)模型训练平台
为模型训练提供计算能力和环境AI由于模型培训对硬件资源的高消耗,平台上常见的产品通常租用云计算资源完成模型培训,因此许多模型培训平台与云平台捆绑,完成负载平衡、平行培训等工作。
4)模型部署平台
从训练环境从训练环境部署到推理环境(云、边缘等)的工具。这个功能相对简单,较少单独作为一个产品,一般是也是作为开发平台的一个功能模块。
例外是边缘/嵌入式环境部署平台EasyEdge),由于硬件适配繁琐,我们可以看到百度已经制成了相对独立的产品。
5)模型推理平台
提供用户直接调用的各种模型接口,一般包括模型调用管理、接口管理等功能。这个推理平台主要以模型为核心竞争力。另一个推理平台以计算能力为竞争力,类似于云平台,用户在平台上部署模型可以获得弹性扩展和容量。
参考蚂蚁AI共享平台,AI根据不同层次的业务需求,平台可分为功能嵌入、API调用、数据训练、模型定制、算法开发。
功能嵌入:通过iframe将功能模块嵌入到自己的系统中,以实现最低的成本。API调用:直接调用平台提供的成熟度API,例如,调用身份证、驾照等OCR识别API。数据培训:平台模型满足需求,但需要提供自己的培训数据来解决具体的场景需求。模型定制:现成的平台模型不符合要求,因此需要配置算法参数,然后培养出满足自身需求的新模型。算法开发:最先进的情况是业务方理解算法,开发新算法。该平台提供了一系列深层次的能力,如算法开发、数据管理、模型培训、模型测试和发布与5级业务需求和生命周期相比,业务按需分层和模型生命周期的各个阶段基本相应。需求越高,生命周期越高。
功能嵌入和API调用级需求只涉及模型推理,数据培训级需求涉及数据标记、培训、部署和推理过程,模型定制和算法开发级需求涉及整个过程的功能。
上图给出了一些AI开发平台产品AI从模型生命周期的覆盖可以看出,大多数产品实际上提供了整个生命周期的功能。当然,这并不意味着上述分析毫无意义。根据生命周期或需求水平拆卸仍然可以帮助我们澄清产品结构。
就我个人而言,我认为百度的功能架构是最舒适和最合逻辑的。百度的AI开发平台包括BML和EasyDL两个,BML全过程开发平台覆盖AI全生命周期模型;EasyDL定位是零门槛开发,只支持数据培训水平的开发。
其实这种拆分是按照上面提到的业务需求等级进行的,拆分后目标用户要清晰得多。BML相对独立的数据相关功能和边缘部署相关功能分为组件/小平台,可供用户单独调用,提高灵活性。
腾讯TI在系列平台中,TI-ONE定位是一站式机器学习服务平台,但目前还没有看到数据标记的功能。数据处理只提供相对简单的数据访问和数据预处理功能。预设模型相对较少,多为机器学习模型,深度学习模型较少。
TI另外两个系列平台TI-Matrix和Ti-EMS分别是“AI应用服务平台和无服务推理平台更倾向于云服务,主要是服务调度、扩张等能力。
华为ModelArts还提供从数据标记到模型推理全过程的开发工具,其中自动学习功能模块基本与百度相匹配EasyDL,生成提供重训练级别的模型,但产品暂时不按要求级别拆分。
AI与支撑平台相比AI更类似于内容审核、智能对话等业务平台的开发平台。围绕核心算法,通过配置提高算法/能力的通用性。
以下图为栗子~横向是发布图片的业务流程,纵向是审计平台的功能,可见审计平台与业务紧密结合。
审计平台的核心实际上是分类问题(输入图片分为合规、不合规),外部输入是图片,输出是图片合规、非法类型、准确性等信息,审计策略的制定和验证是支持图像分类算法在内容审计场景中work,归根结底,支撑是配置和设置。
从用户的角度来看:用户需要的是以尽可能低的成本(时间和费用)获得所需的费用AI能力。AI平台提供的开发工具和预置模型可以减少用户获取AI能力投资。
从AI从平台公司的角度来看:AI平台提供一套标准化的工具/流程,80%的需求可以由标准化的产品来满足,而不是每个需求都可以单独定制。通过AI提升平台等标准化产品ROI,从而实现盈利。
无论是从用户的角度,还是从提供AI事实上,从平台的公司角度来看,AI平台的存在是为了提高投入产出比。
但个人感觉,现在AI平台公司对AI平台的需求大于用户,导致产品多、用户少的尴尬局面。用户对AI一方面,平台的不认可可可能是对的AI能力带来的收入不确定性;另一方面,它可能是AI平台提高ROI不确定性(可能使用)AI但平台仍不能节省人力投入)。所以如何让用户发现AI能力的价值,然后发现AI平台的价值仍然是一个值得思考的问题。
市场上这么多AI平台,如何让用户选择你的产品?差异化。
如何实现差异化?不同用户对AI能力或应用程序的需求不同,但无非是数据、计算能力和模型。
1)数据开始的差异化
目前,许多行业仍然缺乏数据积累,因此数据是这些公司最大的痛点。从数据的角度出发AI最直接的平台是提供行业数据。如果无法获取数据,可以退一步,结合大数据平台提供数据采集、清洗、标注(自动、人工)等功能,解决用户数据的痛点。
前边提到的basicFinder,它是由标签平台逐渐发展起来的AI平台。
2) 算力入手的差异化
{n}{n}
不论是训练阶段还是推理阶段,AI模型对算力都是强依赖的,因此从算力入手的AI平台也是发展最早的一种,一般都和云平台紧密结合,最后的收益落脚点都是云资源。
{n}{n}
随着AI芯片发展,以嵌入式
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。
标签:
评论