云计算·大数据 频道

数据分析Agent的应用价值与风险

  以下内容节选自沙丘智库:《如何利用AI Agent增强数据分析工作流?》

  大语言模型通常用于处理和生成文本类非结构化数据,但是也可以通过将自然语言转化为数据库查询的方式来处理结构化数据,这将意味着整个数据分析流程中的许多步骤可以通过用户输入自然语言指令的方式来执行。

  在数据分析过程中引入AI Agent,对多步骤任务进行精细化控制,可以缩小数据与洞察之间的差距,也是 “大模型+数据分析”实现深度价值的基础。

  01

  基于大模型的数据分析Agent定义

  在《2024年“大模型+数据分析”最 佳实践报告》,沙丘智库认为数据分析下Agent是将AI Agent应用于从数据到洞察的工作流程中,半自主或自主地协调任务,帮助用户更有效地从数据中提取有价值的信息和见解。

  数据分析Agent的典型架构如下所示:

  在数据分析Agent中,用户输入与需要执行的任务、目标或问题有关,辅助基于洞察力的决策制定。基于大语言模型的AI Agent可以执行数据准备、分析、可视化、解释和函数调用等任务,并接收来自用户和其他Agent的进一步输入和反馈。通过将AI Agent应用于数据分析过程中,可以进一步提升分析的自动化和智能化水平。

  AI系统可以根据自己的编程和训练数据执行任务并生成响应,通常不需要持续的人工干预。尽管大语言模型本身在执行数值任务上表现不佳,但其代码生成能力却可用于数据分析。AI Agent的特点在于它们能够用于其他类型的任务和流程自动化,从而超越了单一模型交互的潜力。具体来看,AI Agent的工作方式包括:

  · 将请求拆解为多个子任务;

  · 将子任务交给专门针对特定任务进行微调的模型执行,提高任务执行的效率和准确性;

  · 不仅仅是生成操作指令,还可以通过调用工具来执行操作。

  随着模型架构的不断进步,出现了一些新的系统,这些系统能够进行规划、推理,并在特定任务上表现得更好(例如数学计算任务)。这些新系统有望克服在数据分析过程中使用大语言模型的一些局限性,特别是在处理和分析表格类数据时。

  02

  数据分析Agent的应用价值

  数据分析Agent实现了一种工作流程上的转变,使得在工作流程内或跨工作流程的多步骤任务可以自动执行,只需要用户进行高水平的干预。这缩短了数据分析工作流程的完成时间,加速决策驱动型洞察的生成,最终实现更快的执行速度并对业务产生积极影响。数据分析Agent的其他价值还包括:

  · 增强决策制定:AI Agent可以快速分析大量数据,提出可行的见解,帮助企业做出更明智、更及时的决策。通过识别趋势和模式,AI Agent可以预测未来的结果,从而实现主动决策和战略规划;

  · 提高运营效率:AI Agent可以自动执行数据录入和报告生成等重复性任务,从而释放人力开展更多战略性的活动。AI可以实时处理和分析数据,使企业能够迅速应对不断变化的情况并优化运营;

  · 加强风险管理:AI可以识别异常的模式和现象,帮助企业更有效地发现和预防欺诈行为,AI驱动的分析可以持续监控数据是否符合监管要求。

  03

  数据分析Agent的应用风险

  由于当前技术还不够成熟,数据分析Agent在使用时会面临如下风险:

  · 数据分析Agent通常使用大语言模型作为主要处理组件,但大语言模型的幻觉问题、输出错误或工具使用不当可能会导致系统失败;

  · 使用大语言模型处理结构化数据(这对于数据分析来说是必要的)时存在风险,执行链路上的多个环节都有可能出现准确率的折损,导致最终输出结果的准确率较低。当前系统中经常出现问题的环节包括将自然语言可靠地转化为SQL、解释复杂的模式、执行不同类型的分析任务、有效地将结果返回给用户。

  · 使用数据分析Agent的低门槛反而提高了用户使用这些输出进行决策时所需的治理、信任和可信度水平,许多用户在经历一次糟糕的结果后就不会再使用这些系统;

  · 成功使用数据分析Agent可能会导致用户过度依赖生成的输出结果,对输出结果的人工检查和验证往往会被跳过或忽略;

  · 数据分析Agent和大语言模型输出的可解释性普遍较低。通过在Agent框架中多次调用大语言模型回溯步骤的方式来查找故障和错误,反而会增加开发时间;

  · AI Agent通常可以半自主或完全自主地行动,并且能够主动地在目标环境中学习和适应。这种自主性带来了显著的风险,因为AI的不当表现可能导致企业做出次优的业务决策;

  · AI Agent具有重大的安全和伦理问题。它们可能需要访问机密数据才能实现目标,涉及到数据隐私的问题。由于AI Agent能够自主行动,一旦出现错误或数据泄露,责任归属也将成为一个严重的问题。

0
相关文章