重磅新品 MySQL HeatWave 机器学习(ML)
Oracle于2022年3月29日,在Oracle的云上发布了MySQL HeatWave 机器学习(ML)。Oracle MySQL HeatWave除了用于事务处理和分析之外,现在还支持数据库内机器学习 (ML)。MySQL HeatWave ML对 ML 的生命周期完全自动化,并将所有经过训练的模型存储在 MySQL 数据库中,用户无需将数据或模型移动到机器学习工具或服务中。消除 ETL ,可降低应用程序复杂性、降低成本并提高数据和模型的安全性。
以往,在MySQL中使用机器学习时,用户需要对数据库表执行ETL (Extract, Transform, Load)。数据必须从数据库中提取出来,用户需要学习并使用第三方工具和库来训练模型,然后进行推理和解释。除了繁琐和耗时之外,该过程还可能会在数据库之外产生大量数据,从而导致数据安全和治理问题。
HeatWave ML允许MySQL用户训练模型,生成推理和解释,而不需要从MySQL数据库中提取数据,并具有如下优点:
•全自动:HeatWave ML完全自动创建调优模型,生成推理和解释,从而避免了用户成为专家ML开发人员的需要
•SQL接口:提供熟悉的MySQL接口,用于调用机器学习功能
•安全性和效率:数据和模型永远不会离开MySQL数据库。客户端或任何其他服务都不会看到存储在数据库服务中的数据或模型
•解释:所有由HeatWave ML创建的模型都可以解释。企业需要对机器学习模型的预测进行解释,以建立信任,证明公平,并遵守监管要求。
•性能和可伸缩性:与Redshift ML等类似产品相比较,HeatWave ML能够以更低的成本获得了更好的性能。此外,HeatWave ML可以随集群的大小进行伸缩。
•易于升级:HeatWave ML利用最先进的开源Python ML包,使够持续和迅速地吸纳更新(和改进)的版本。
HeatWave中的ML功能被整合到数据库中,用户不必从数据库中提取数据。训练、推理和解释活动均在数据库中执行,不需要移动数据。分析查询和ML查询共享一个公共的查询队列,分析查询优先级高于ML查询。注意,分析数据和ML数据将共享内存资源,ML内存使用限制为预先设置的内存限制。
HeatWave ML利用了Oracle AutoML技术,它可以自动生成模型。可以代替数据科学家执行费时费力的任务:
1. 预处理的数据
2. 从一组算法中选择一个算法来创建一个模型
3.选择一个合适的有代表性的数据样本
4. 只选择相关的特征来加速管道,减少过度拟合
5. 超级参数调优
6. 确保模型能够很好地处理不可见的数据(泛化能力)
Oracle AutoML有一个可扩展的设计,通过广泛使用元学习来最小化试验次数,并在给定时间预算的情况下提供一个最佳模型。这种成熟的技术已经集成到各种Oracle产品中,包括OCI数据科学服务和Oracle数据库。
MySQL HeatWave是唯一一个在MySQL数据库中直接支持OLTP、OLAP和机器学习的云数据库服务,避免了复杂、耗时、昂贵的数据移动和与单独的分析或机器学习服务的集成。基准测试表明,HeatWave ML 训练模型的速度提高了 25 倍,成本仅为 Amazon Redshift ML 的 1%,而不会影响准确性,并且随着节点的添加而扩展。
HeatWave ML可供MySQL HeatWave客户免费使用。对HeatWave感兴趣的读者可以访问“https://www.oracle.com/mysql/”了解详情。
感谢您关注“MySQL解决方案工程师”!