本文共 1629 字,大约阅读时间需要 5 分钟。
Google Assistant,Amazon Alexa,Microsoft Cortana,Apple Siri或Facebook Messaging M之间的共同点是什么? 所有这些个人助手均由机器学习和人工智能(AI)推动。 根据和 ,机器学习是2017年技能,并且将持续多年。
您将如何发展技能,成为下一位机器学习工程师?
, , 和其他资源提供了MOOC(大规模开放在线课程),并且Amazon.com列出了5,000多本有关机器学习的书籍。 这些标题中的许多标题都可以帮助您入门,并通过动手知识逐步将您带入更高的层次。 此外,前Google工程师,领导YouTube视频分类团队的AurélienGéron也写了一本很棒的书: 。 这是一本实用的指导书,用于动手 (一类机器学习算法)。
这本书假定您对机器学习几乎一无所知。 但是,这本书还假设您具有一些Python编程经验,并且对大学水平的数学有一定的了解,包括线性代数,概率和统计量。 机器学习项目通常使用Python,R,Java / Scala和C / C ++作为编程语言。 Géron并没有让我们实现自己的机器学习算法的玩具版本,而是使用了可用于生产的Python框架和 。 两者都是积极开发的开源项目。
scikit-learn项目是David Cournapeau于2007年发起的Google夏季代码项目。Scikit-learn致力于使用通用的高级语言(如Python)将机器学习带给非专业人员。 根据 ,Spotify将scikit-learn机器学习包用于音乐推荐,而Evernote则将其用于音符分类。 它提供了基本的机器学习算法的高质量,易于使用的实现,包括回归,分类,聚类等。 Scikit-learn是学习机器学习的很好的切入点,并且是GitHub上第二高星级的机器学习库。
TensorFlow是Géron评估的第二个项目。 从2011年开始,Google Brain构建了 ,这是一个基于深度学习神经网络的机器学习系统。 TensorFlow是Google Brain的第二代机器学习系统,于2015年作为开源软件发布。Google使用TensorFlow神经网络模型进行语音识别,而Snapchat使用它进行图像识别。 它提供了用于神经网络和深度学习的高级机器学习算法,并且是GitHub上使用最多的机器学习库。
该书的核心优势在于它专注于端到端机器学习项目。 一个典型的机器学习项目涉及八个步骤:
该书使用加利福尼亚州的公共普查数据来预测整个地区的房价。 第一步,这本书有助于解决问题-这是带有的监督学习问题。 根据所需的精度,下一步是选择性能指标; 例如,系统价格预测的68%落在实际价值的50,000美元以内,而系统价格预测的95%落在实际价值的100,000美元以内。
Scikit-learn提供了一些工具来获取数据,浏览数据,清理数据以及为机器学习算法准备数据。 一旦完成,下一步就是选择和训练模型。 机器学习项目的一大挑战是选择正确的模型,这将提供更好的预测准确性。 经验丰富的机器学习专家会选择三到四个模型,然后根据结果的准确性选择其中一个模型。
对于房价预测,Géron选择 , 和模型。 他发现随机森林在此问题上的表现优于其他两个模型。
本书涵盖了更多的机器学习算法及其相关性和用法,并且包括涵盖了监督学习,非监督学习,半监督学习和强化学习的代码示例。 您的机器学习问题可能是细分客户并为每个组找到最佳的营销策略,检测哪些交易可能是欺诈性的,并预测明年的收入。
阅读:
翻译自:
转载地址:http://nfjzd.baihongyu.com/