谷歌搜索引擎入口 023dir(谷歌搜索引擎首页)_好文分享

安妮岳排槐发自凹非寺

量子位出品 | 公众号 QbitAI

如果你的心里只有一件事。

请问：是不是学习？

Google希望你是，而且还准备扶上马，再送一程。

所以今天一早，大礼包又来了。

今年春天，Google发布了机器学习速成课，英文简称MLCC。而且这套基本全程都有中文的课程，还是完全免费的。

这还不够。

Google觉得光学理论还不够，必须教你理论与实战相结合。

所谓：知行合一。

于是，Google发布了最新的一套课程：Machine Learning Practica（机器学习实践）。这套课程会示范Google如何在产品中使用机器学习。

课程地址在此：

https://developers.google.com/machine-learning/practica/

（.cn域名地址亲测可用）

与之前的课程不同，这套动手实践课程中，包括视频、文档和交互式编程练习。目前已经上线的第一课是图像分类。

在图像分类的实践课程中，可以学习Google如何开发利用最先进的图像分类模型，这也是Google相册背后的核心技术。

迄今为止，已有超过1万名Google员工利用这个实践课程来训练他们自己的图像分类器，最终实现可以识别照片中的猫猫狗狗。

想要学习这套课程，也有一些基础要求。

主要是两点：

这套实践课程使用了Keras API。以及课程中的编程练习，使用了Colab。使用Colab不要求之前有过Keras经验。

课程中代码基本可算是提供了逐步的解释。

目前这套实践课程只发布了图像分类一组，但Google表示更多的实践课程正在：肮！啧！味！

在这个课程中，Google首先介绍了图像分类的基本原理，讲述了卷积神经网络（CNN）的构建，以及池化、全连接等概念。

然后，Google会引导你从头开始构建一个CNN网络，并且学习如何防止过拟合，以及利用训练模型进行特征提取和微调。

实践课程一共包括三组练习，分别是：

量子位潜入这个课程内部，带回了第二个实践练习。在这堂课里，谷歌想教会大家在猫狗图像分类中，如何减少过拟合。大家感受一下——

练习2：减少过拟合

预计完成时间：30分钟

在本节练习中，我们将基于在练习1中创建的模型将猫狗分类，并通过一些策略减少过拟合：也就是 数据增强 （Data Augmentation）和正则化方法 dropout ，从而提高准确性。

和大象被关进冰箱一样，这得分四步走：

Let’s get started吧！

数据增强の探索

数据增强是减少视觉模型过拟合的基本方法了，因为我们手头的训练实例为数不多，为了充分利用，我们可通过一些随机的变换“增强”它们，对模型来说，这是不同的图像~

这可以通过在ImageDataGenerator实例读取的图像上增加一些随机转换来实现，比如：

还有一些可用的选择：

注意：此练习中使用的2000张图片摘自Kaggle上的“狗vs猫”数据集，包含25000张图片。为了节约训练时间，这里我们只用到其中的一个子集。

接下来，我们将datagen转换应用到训练集里的猫咪图像，生成5个随机变量。这个单元需多运行几次，找到新批次中的随机变量。

在数据处理过程中应用数据增强

现在，将上述增强的数据应用到数据预处理配置中——

神奇之处是，若用增强的数据来训练模型，则不会被认为是相同示例（虽然它们都是从一张图片上得到的）。不过模型眼中这些输入仍紧密相关的，所以还 不足以完全消除过拟合 。

加入Dropout

不过~还有另外一种流行的策略能减少过拟合，即dropout。

如果你想了解过拟合的基本概念，这里自卖自夸推荐两个之前免费课程中的相关介绍：

https://developers.google.com/machine-learning/crash-course/training-neural-networks/video-lecture

https://developers.google.com/machine-learning/crash-course/

我们从练习1重新配置我们的convnet架构，在最后的分类层前试图添加一些dropout。

重新训练模型

随着数据的增加和dropout的填入，我们需要重新训练convnet模型。

这一次，我们训练全部的2000张图片，训练了30轮，并对验证了所有的1000个测试图像。

这可能需要几分钟的时间，检验一下你是否能自己编写代码了。

评估结果

接下来，我们用数据增强和dropout评估模型训练的结果。

结果不错！模型已经不再过拟合。

事实上，从我们的训练资料来看，随着训练次数的增加，模型的准确度会达到80%!

清理

在运行练习3之前，我们还需要运行以下单元来释放kernel和空闲的内存资源：

不知道是不是忙中出错，Google这套全新的课程，在我们发稿的时候，遇到了一个尴尬的问题：练习课程无法访问。

你点击练习之后，原本应该是转入一个Colab页面，但是却把多数用户挡在一个这样的界面之上。如图：

链接地址：https://login.corp.google.com

这是啥？

其实，这就是大名鼎鼎的 moma ，一个Google内部的搜索工具。如果你是Google员工，就能登录访问，进入Google内网。

可能是因为这套实践课程，和MLCC一样，也是之前面向Google内部的课程，所以出现了现在略微尴尬的一幕。

估计，可能很快会修复这个问题。

所以你可以先看看上面量子位搬运的课程示范。

不急~

— 完 —

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

?'?' ? 追踪AI技术和产品新动态

本文链接：https://www.24zzc.com/news/169347374226933.html

谷歌搜索引擎入口 023dir(谷歌搜索引擎首页)

相关文章推荐

好文分享最新文章

蜘蛛工具

您可能感兴趣的文章

蜘蛛套餐

超级蜘蛛池优化

域名筛选工具

文本处理工具

谷歌搜索引擎入口 023dir(谷歌搜索引擎首页)

相关文章推荐

好文分享最新文章

蜘蛛工具

您可能感兴趣的文章