机器学习和其他人工智能功能正在扩展到每个行业。机器正在分析数据以撰写新闻文章,预测汽车零件何时会失效,识别客户情绪,检测信用卡欺诈,驾驶汽车,诊断癌症并识别犯罪行为。
在这些方面做出错误决策的后果是什么?有偏见的数据可能会促使机器做出决策,其后果从虚假新闻和无关广告到虚假逮捕甚至死亡。
许多公司正在浪费数百万美元来开发未能达到期望的创新产品。一些公司正在做正确和蓬勃发展。有什么不同?明确的结果和良好的分析!
但这不是传统分析。通过机器学习,机器可以通过模式自行学习决策逻辑,而不必使用需求的逻辑规范进行显式编程。该机器而不是BA使用数据来识别业务规则和许多需求。这是否意味着BA已过时?绝对不!当我们依靠机器做出决策时,BA技能就显得尤为重要。为什么?
因为没有人,机器仍然无法做出正确的决定
人们在机器学习中扮演着不同的角色!从事机器学习项目的学士学位将他们的工作从传统的需求启发和分析转移到了对实验和解决方案评估的更多关注上。
解决方案评估是关于构建的解决方案,机器学习算法,以及它如何满足用户和业务需求。该解决方案不必完全构建就可以进行评估-原型或最低限度可行的产品是一个很好的起点。
解决方案评估周期如下所示:
定义期望的结果
许多机器学习解决方案失败是因为团队仅专注于技术而忽略了上下文,目的和预期结果。在任何新项目的开始,这都是BA的关键步骤。在机器学习的情况下,BA会基于了解以下四个因素来定义(并不断完善)期望的结果:
- 机器正在使用的数据来源的用户/人员
- 用户的同情状态及其过程和工作流
- 用户组和源数据的潜在偏差
- 如何分析机器的输出并清理数据以消除造成实际和道德问题的偏差
广告
了解数据
我们都听说过GIGO,对吗?垃圾进垃圾出。对于做出自动决策的系统所使用的数据而言尤其如此。如果一个数据点错误,丢失或被误解,则组织和用户将遭受后果。
BA的角色是了解数据并不断评估数据集。 BA有助于团队确信机器拥有正确的数据来解决问题并朝正确的方向移动结果。广管局需要知道:
- 数据来自哪里
- 数据如何影响机器的决策
- 哪些数据对实现期望的结果有意义
让机器学习
团队的一个陷阱是花费大部分时间和精力来定义,构建和分析过程的这一部分。他们如此专注于实际的机器学习技术,以致错过了通过实验和分析进行迭代学习的重要性。
由于团队无法在技术,数据,客户和期望的结果之间建立联系,因此这导致团队走上了自我毁灭的道路。
Experiment 和 Analyze
成功的机器学习解决方案需要多个实验和分析周期。这项工作使我们可以洞悉需要解决的问题。这些见解比对用户请求列表做出反应要有意义得多。 BA使用这些见解来更改数据,完善问题并修改变量,以发现对机器学习方式的影响。
但是,学士学位本身并不在立方体中这样做!相反,它是一种协作工作,包括客户或至少以客户为中心的方法。为了帮助机器做出正确的决策,BA会使用实验和分析来:
- 观察什么对用户/客户有效
- 分析与结果相关的业务和用户指标
- 分析用户体验,客户体验,数据流和流程,以确定整体流程和解决方案的执行情况
- 分析实时数据以查看用户如何与解决方案进行交互
- 识别任何会导致机器决策产生偏差的数据
消除偏见
在团队进行实验和分析之后,是时候完善期望的结果并根据需要更新数据以实现结果了。该过程的很大一部分要求BA消除机器学习结果中确定的偏见。
该团队以多种方式管理偏差数据。他们能:
- 删除有偏见的数据
- 重新培训机器以不同方式处理偏差数据
- 调整用户的输入过程以消除/解决偏差数据
跳过或最小化实验和分析的团队在失败的项目上浪费了数百万美元。提倡客户交互,上下文,数据质量,结果的重要性,并根据实验优化数据,从而帮助您的机器做出更好的决策。
机器决策应该对我们的客户和我们的组织有意义。这就需要人与人之间的接触!