博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
书评:使用Scikit-Learn和TensorFlow进行动手机器学习
阅读量:2527 次
发布时间:2019-05-11

本文共 1629 字,大约阅读时间需要 5 分钟。

Google Assistant,Amazon Alexa,Microsoft Cortana,Apple Siri或Facebook Messaging M之间的共同点是什么? 所有这些个人助手均由机器学习和人工智能(AI)推动。 根据和 ,机器学习是2017年技能,并且将持续多年

您将如何发展技能,成为下一位机器学习工程师?

机器学习入门

, , 和其他资源提供了MOOC(大规模开放在线课程),并且Amazon.com列出了5,000多本有关机器学习的书籍。 这些标题中的许多标题都可以帮助您入门,并通过动手知识逐步将您带入更高的层次。 此外,前Google工程师,领导YouTube视频分类团队的AurélienGéron也写了一本很棒的书: 。 这是一本实用的指导书,用于动手 (一类机器学习算法)。

这本书假定您对机器学习几乎一无所知。 但是,这本书还假设您具有一些Python编程经验,并且对大学水平的数学有一定的了解,包括线性代数,概率和统计量。 机器学习项目通常使用Python,R,Java / Scala和C / C ++作为编程语言。 Géron并没有让我们实现自己的机器学习算法的玩具版本,而是使用了可用于生产的Python框架和 。 两者都是积极开发的开源项目。

为什么要使用scikit-learn和TensorFlow?

scikit-learn项目是David Cournapeau于2007年发起的Google夏季代码项目。Scikit-learn致力于使用通用的高级语言(如Python)将机器学习带给非专业人员。 根据 ,Spotify将scikit-learn机器学习包用于音乐推荐,而Evernote则将其用于音符分类。 它提供了基本的机器学习算法的高质量,易于使用的实现,包括回归,分类,聚类等。 Scikit-learn是学习机器学习的很好的切入点,并且是GitHub上第二高星级的机器学习库。

TensorFlow是Géron评估的第二个项目。 从2011年开始,Google Brain构建了 ,这是一个基于深度学习神经网络的机器学习系统。 TensorFlow是Google Brain的第二代机器学习系统,于2015年作为开源软件发布。Google使用TensorFlow神经网络模型进行语音识别,而Snapchat使用它进行图像识别。 它提供了用于神经网络和深度学习的高级机器学习算法,并且是GitHub上使用最多的机器学习库。

端到端机器学习项目

该书的核心优势在于它专注于端到端机器学习项目。 一个典型的机器学习项目涉及八个步骤:

  1. 看大图
  2. 获取数据
  3. 可视化数据以获取见解
  4. 准备用于机器学习算法的数据
  5. 选择一个模型并训练
  6. 微调模型
  7. 提出解决方案
  8. 启动,监视和维护机器学习系统

样例项目:房价预测

该书使用加利福尼亚州的公共普查数据来预测整个地区的房价。 第一步,这本书有助于解决问题-这是带有的监督学习问题。 根据所需的精度,下一步是选择性能指标; 例如,系统价格预测的68%落在实际价值的50,000美元以内,而系统价格预测的95%落在实际价值的100,000美元以内。

Scikit-learn提供了一些工具来获取数据,浏览数据,清理数据以及为机器学习算法准备数据。 一旦完成,下一步就是选择和训练模型。 机器学习项目的一大挑战是选择正确的模型,这将提供更好的预测准确性。 经验丰富的机器学习专家会选择三到四个模型,然后根据结果的准确性选择其中一个模型。

对于房价预测,Géron选择 , 和模型。 他发现随机森林在此问题上的表现优于其他两个模型。

本书涵盖了更多的机器学习算法及其相关性和用法,并且包括涵盖了监督学习,非监督学习,半监督学习和强化学习的代码示例。 您的机器学习问题可能是细分客户并为每个组找到最佳的营销策略,检测哪些交易可能是欺诈性的,并预测明年的收入。

阅读:

翻译自:

转载地址:http://nfjzd.baihongyu.com/

你可能感兴趣的文章
07 Mybatis的多表查询1----1对多和多对1
查看>>
debian和ubuntu的sh dash bash
查看>>
java9-8 局部内部类
查看>>
数据库分页
查看>>
Centos6.8源码编译安装PHP7
查看>>
012 debug调试工具的指令
查看>>
慕课网消息的接收与响应3
查看>>
第三十二讲:UML类图(下)
查看>>
linux下更改时区
查看>>
复杂链表的复制
查看>>
code vs 3376 符号三角形
查看>>
[CF193B] Xor(暴力,剪枝,异或)
查看>>
[CF825D] Suitable Replacement (贪心乱搞)
查看>>
大数据笔记(二十五)——Scala函数式编程
查看>>
win7 IIS7 运行vs2003 web 项目 无法识别的配置节“system.webServer” 解决
查看>>
jQuery源码分析_工具方法(学习笔记)
查看>>
有穷自动机的转换
查看>>
ncbi-blast 本地安装
查看>>
在android上使用 stand-alone toolchains移植 transmission
查看>>
小议IT公司的组织架构
查看>>