小白的ai产品经理入门之路

概述:本人21班毕业后一直从事产品经理相关岗位,从事过云视频剪辑、跨境电商等行业,目前正在向云计算行业转型。别的不说,跨度真的挺大的,其实两者真的没什么大关系。但因为兴趣,最终还是要选择一个自己最感兴趣的行业去深挖和提升自己,深入业务场景去了解需求,与用户共情。这是我目前的目标和方向。接下来我就分享一些我的AI产品进阶知识的点点滴滴或者干货。欢迎大家批评指正,也欢迎初出茅庐的小姐姐们和我一起成长,互相交流。

第一篇:初次相识

quyc 2022年4月27日

人工智能平台知识概述

一、理解(什么)的概念

在说AI平台之前,我们可以先对AI做一个大概的解释。AI即人工智能,是一门研究、模拟、延伸和扩展人脑复杂行为的技术科学,包括机器学习、计算机视觉等。那么AI平台就是支持这种复杂科学研究的辅助工具,可以智能化、系统化、自动化的完成这一系列的研究。

1)AI平台主要面向模型开发者,围绕AI模型/算法的生命周期(数据采集、数据标注、模型构建、模型训练、模型优化、模型部署)提供工具。

2)AI平台面向用户,围绕集成的AI服务部署应用,主要进行应用管理等相关操作。

二、产品功能(How)

接下来将对AI平台的两个分类的功能逐一进行描述。

2.1人工智能开发平台

1)数据标注平台

模型训练的前期工作,包括数据导入、数据预处理、数据标注、数据增强等。这部分数据工作与大数据有很强的相关性,有些标注平台甚至是大数据系统的组成部分。

对于AI标注来说,数据处理更加智能化/自动化,所以一些厂商推出了数据采样、数据拆分、数据缺失值处理(数据预处理)、自动标注(数据标注)、图片类型数据去雾、雾化、对比度增强等智能算法(数据增强),而支撑数据标注平台的正是这些功能。

2)模型训练平台

为模型训练的内容配置计算能力和环境,是AI平台中常见的产品。由于模型训练对硬件资源的消耗较高,通常租用云计算资源来完成模型训练,所以很多模型训练平台都捆绑云平台来完成包括负载均衡、并行训练等工作。

4)模型部署平台

提供工具将模型从训练环境部署到推理环境(云、edge等)。).这个功能比较简单,较少单独作为一个产品,一般作为开发平台的一个功能模块。

一个例外是edge/嵌入式环境的部署平台(如百度EasyEdge)。由于硬件适配复杂,百度目前被看做是一个相对独立的产品。

5)模型推理平台

提供多种模型接口供用户直接调用,一般提供模型调用管理、接口管理等功能。这个推理平台主要以模型为核心竞争力。另一种推理平台以计算能力为竞争力,类似于云平台。用户可以通过在平台上部署模型来获得弹性伸缩的能力。

2.2 ?人工智能应用平台

与AI开发平台相比,AI支撑平台更类似于业务平台,比如内容审核、智能对话等。围绕一个核心算法,通过配置提高这个算法/能力的通用性。

通过下面的例子详细说明:

横向是发布图片的业务流程,纵向是审核平台的功能。审核平台的核心问题是图片的分类,符合审核政策要求的图片被限制。

三、核心优势(为什么)

AI平台带来的优势可以从用户和平台两个角度来考虑:

用户:低成本获取AI能力,提高工作效率,满足业务快速拓展的需求;

AI平台:标准化的工作工具/流程,无需定制即可解决,提高模型生产效率,降低工作成本,从而形成利润;

但目前平台的需求大于用户的需求,这与AI的发展历史有关。目前AI技术还处于初级阶段,更多的是对模型训练的需求,一个行业解决方案标准化的过程;用户AI仍持观望态度(不确定提高ROI等。),所以得出结论,需要不断加强AI能力的培养,以更好地满足市场用户的需求,同时需要不断引导用户发现AI能力的价值,从而提升AI平台的价值。

四、市场情况(在哪里)

部分AI开发平台产品的生命周期覆盖显示,大部分产品实际上都提供了全生命周期功能,提供一站式解决方案。

竞争产品分析:

百度的功能架构是最舒服最符合逻辑的。百度的AI开发平台包括BML和EasyDL。BML是全流程开发平台,覆盖AI模型的全生命周期。EasyDL定位是零门槛开发,所以只支持开发到数据训练级别。BML相对独立的数据相关功能和边缘部署相关功能也拆分成组件/小平台,用户可以独立调用,提高了灵活性。

在腾讯的TI系列平台中,TI-ONE的定位是“一站式机器学习服务平台”,但暂时还没有看到数据标注的功能,数据处理也只是提供了相对简单的数据访问和数据预处理的功能。预设模型相对较少,大部分是机器学习模型,深度学习模型很少。

TI系列的另外两个平台TI-Matrix和Ti-EMS分别是“AI应用服务平台”和“无服务推理平台”。个人更倾向于云服务,主要是在服务调度、容量扩充和收缩方面。

华为ModelArts还提供从数据标注到模型推理全过程的开发工具。其中“自动学习”功能模块基本对标百度EasyDL,提供模型生成重训练级别,但产品暂时没有按照需求级别进行拆分。

总结:目前AI平台根据用户的不同需求各有侧重,但一站式平台的训练能力基本都是部署的,主要在数据、模型、部署三个方面;

1)数据差异化:进一步与大数据平台保持一致,提供数据采集、清洗、标注(自动和手动)等功能,解决用户数据痛点。

2)模型差异化:为模型训练提供更强大的预置算法,针对不同业务场景的模型训练,针对不同业务场景的优化。其次,需要丰富的实例资源与云平台进行良好的连接和协同处理。

3)部署差异化:方便、快捷、快速建设、灵活应用成为部署需要克服的一大难点,也是非常重要的竞争优势,节省时间和人力成本,方便运维;