深度:什么是AI工厂?AI工厂远超我们的认知

 行业动态     |      2023-02-23 17:31

  如果您关注有关人工智能的新闻,则会发现两个不同的话题。媒体和电影院经常将AI描绘成具有人类般的能力,大量失业以及可能出现的机器人世界末日。另一方面,科学会议讨论了人工智能的发展,同时承认当前的AI弱小且无法实现人类思维的许多基本功能。

  但是,无论它们与人类智能相比处于什么地位,当今的AI算法已经成为许多领域(包括医疗保健,金融,制造,运输等)的定义组件。正如哈佛商学院教授Marco Iansiti和Karim Lakhani在他们的著作《人工智能时代的竞争:算法和网络运行世界时的战略与领导力》中所解释的,不久之后,“人类的努力领域将永远不会脱离人工智能。”

  实际上,弱小的AI已经引领了Google,Amazon,Microsoft和Facebook等公司的成长和成功,并正在影响数十亿人的日常生活。正如Lakhani和Iansiti在书中所讨论的那样,“我们不需要完美的人工复制品来对社交网络上的内容进行优先排序,制作完美的卡布奇诺咖啡,分析客户行为,设定最佳价格,甚至显然不需要按照这种样式进行绘画伦勃朗。不完美,虚弱的人工智能已经足以改变公司的性质及其运作方式。”

  懂得运行以人工智能为动力的企业的规则的创业公司已经能够创造新市场并颠覆传统行业。适应AI时代的老牌公司幸存并蓬勃发展。那些固守旧方法的公司在失去利用AI力量的公司的基础之后已经不复存在或被边缘化。

  Iansiti和Lakhani讨论了许多主题,其中包括概念AI工厂,这是使公司能够在AI时代竞争和发展的关键组成部分。

  什么是AI工厂?

  当今业务中使用的关键AI技术是机器学习算法,可以从过去的观察中收集模式并预测新结果的统计引擎。机器学习算法与其他关键组件(例如数据源,实验和软件)一起可以创建AI工厂,一组相互连接的组件和流程,以促进学习和成长。

  这就是AI工厂的工作方式。从内部和外部来源获得的质量数据训练了机器学习算法,以对特定任务进行预测。在某些情况下,例如疾病的诊断和治疗,这些预测可以帮助人类专家做出决定。在其他方面(例如内容推荐)中,机器学习算法可以在几乎没有人工干预的情况下自动执行任务。

  AI工厂的算法和数据驱动模型允许组织测试新的假设并进行更改以改善其系统。这可以是添加到现有产品中的新功能,也可以是在公司现有资产基础上构建的新产品。这些变化反过来又使公司可以获取新数据,改进AI算法,并再次找到提高性能,创建新服务和产品,发展并跨市场移动的新方法。

  “从本质上讲,人工智能工厂在用户参与,数据收集,算法设计,预测和改进之间创造了良性循环,” Iansiti和Lakhani在《人工智能时代的竞争》中写道。

  建立,衡量,学习和改进的想法并不是什么新鲜事物。企业家和初创企业已经讨论和实践了很多年。但是,人工智能工厂通过进入自然语言处理和计算机视觉等领域将这一循环提升到一个新的水平,直到几年前,这些领域的软件普及率还非常有限。

  关于AI时代的竞争的例子之一是Ant Financial(现称为Ant Group),该公司成立于2014年,拥有9000名员工,并在超过7亿美元的帮助下为超过7亿客户提供广泛的金融服务。非常高效的AI工厂(和天才领导)。从这个角度来看,美国银行成立于1924年,拥有209,000名员工,为6700万客户提供种类有限的产品。

  “蚂蚁金服只是一个不同的品种,” Iansiti和Lakhani写道。

  AI工厂的基础架构

  众所周知的事实是,机器学习算法严重依赖大量数据。数据的价值引起了一些习惯用法,例如“数据就是新油”,这是一种陈词滥调,已在许多文章中使用。

  但是,仅大量数据并不能构成好的AI算法。实际上,许多公司都坐拥大量数据存储,但是他们的数据和软件存在于单独的孤岛中,存储方式不一致,模型和框架也不兼容。

  “即使客户将企业视为一个统一的实体,但在内部,跨部门和职能的系统和数据通常都是分散的,从而阻止了数据的聚合,延迟了见解的产生,并使得无法利用分析和人工智能的力量,” Iansiti和Lakhani写道。

  此外,在将数据馈送到AI算法之前,必须对其进行预处理。例如,您可能想利用与客户往来的历史来开发一个由AI驱动的聊天机器人,该机器人可以自动执行部分客户支持。在这种情况下,必须先对文本数据进行合并,标记化,去除过多的单词和标点符号,并进行其他转换,然后再将其用于训练机器学习模型。

  即使在处理诸如销售记录之类的结构化数据时,也可能存在缺口,信息丢失以及其他需要解决的不准确之处。而且,如果数据来自各种来源,则需要以不会引起错误的方式进行汇总。如果没有预处理,您将在低质量数据上训练机器学习模型,这将导致AI系统运行不佳。

  最后,内部数据源可能不足以开发AI管道。有时,您需要使用外部来源来补充信息,例如从社交媒体,股市,新闻来源等获得的数据。一个例子就是BlueDot,该公司使用机器学习 来预测传染病的传播。为了训练和运行其AI系统,BlueDot会自动从数百个来源收集信息,包括来自卫生组织的声明,商业航班,牲畜健康报告,卫星的气候数据以及新闻报道。公司的大部分工作和软件都是为收集和统一数据而设计的。

  在《竞争的AI时代》中,作者介绍了“数据管道”的概念,它是一组组件和过程,用于合并来自各种内部和外部来源的数据,清理数据,对其进行集成,对其进行处理并存储以用于在不同的AI系统中使用。但是,重要的是数据管道以“系统,可持续和可扩展的方式”工作。这意味着应避免最少的手动工作,以免造成AI工厂的瓶颈。

  Iansiti和Lakhani还扩展了AI工厂其他方面所面临的挑战,例如为监督的机器学习算法建立正确的指标和功能,在人类专家见解和AI预测之间找到正确的鸿沟,以及应对运行方面的挑战实验并验证结果。

  “如果数据是为AI工厂提供动力的燃料,则基础设施将构成输送燃料的管道,而算法就是完成工作的机器。反过来,该实验平台控制将新燃料,管道和机器连接到现有操作系统的阀门。”

  举报/反馈