- 08/07
- 2020
-
QQ扫一扫
-
Vision小助手
(CMVU)
手编码可能会养成习惯,并产生无法预料的长期后果
很多时候,最初以简单的手工编码SQL脚本开头的内容变成了数十页的未记录,不兼容的脚本,这些页面难以重复,审核,验证和验证,结果是出现意外问题,作业延误以及额外费用。
实时流和机器学习功能
实时从手机接收加速度传感器数据,将数据推送到消息队列中,并执行机器学习对数据进行分类以进行分析,我是否提到这一切都无需手动编码即可完成?在处理方面,使用创建REST端点,可以将传感器数据发送到该端点,传感器数据被解析并推入消息队列,一旦数据进入消息队列就会使用滑动窗口从队列中读取消息,将数据通过机器学习模型传递,并准备进行可视化处理。
正在处理的数据来自移动设备上的加速度传感器
更具体地说,我们正在处理X,Y和Z轴的线性加速度,只需从传感器数据的图形中进行快速而肮脏的分析,每个轴的加速度以m / s 2表示。我们可以从视觉上推断出活动分为三个阶段:低,高和中等。为了将其转换为机器学习模型,我们希望所选模型能够将传感器数据分类为低,中或高。在机器学习中,分类是指识别观察值所属的类别。
由于我们处理的是十进制数字,因此不太适合
回归模型将无法处理低活动,中活动和高活动所需的多类分类,最后随机森林模型允许我们针对每个轴进行分类,随机森林模型在较大的数据集上也很有效,并且可以处理数千个输入变量,随机森林模型通过获取训练集并执行随机采样以创建数据或随机“ 树”的子集来工作,创建许多树后,它将创建一个随机的“森林”,拥有许多树的好处是我们将获得更准确的数据分类预测,例如,如果森林中每10棵树中有7棵表明某个特定的传感器事件正在行走,则预期分类将在行走。
实时大数据平台随附用于机器学习的预构建组件
使用随机森林模型的第一步是使用手工分类进行训练,这意味着我们从快速而肮脏的分析中获取数据,并添加活动标签,模型编码器将使用此训练集来输出模型,以在流传输期间对活动进行分类,训练集中的标签将与人类活动相关,特别是休息,散步和跑步。
用于生成此模型的特定训练集每个活动约有150个事件
采用生成的模型并将手工分类的标签与输出进行比较,可以得出97%的准确性,为了评估机器学习模型的准确性,我们使用K折交叉验证技术并运行10个单独的学习练习,每个练习都对训练集进行划分,然后将其用作验证数据,在我们选择的模型中,该技术产生了95%的精度,在以后的博客中,我们将探讨这种验证技术以及如何使用构建。
流传输部分中使用该模型对我们的数据进行分类
在对数据进行分类之前,还可以将其捕获并存储起来,以备将来分析之用,然后准备分类的数据以进行可视化,最引人注目的部分是不需要手动编码的事实。
- 上一条:织物缺陷图像识别算法研究
- 下一条:了解天线设计和匹配网络