🔍
入门 免费 中文English

Google 机器学习速成课

Google Machine Learning Crash Course

Google · Google 工程师团队 · 约 15 小时

🎬 课程视频

Google 官方出品的机器学习入门课,有中文版。包含视频、练习题和实战项目,用 TensorFlow 做实验。适合有一点编程基础的人。

📖 你将学到

  • 机器学习基本概念
  • 线性回归、逻辑回归
  • 神经网络基础
  • TensorFlow 实战练习

01 机器学习核心概念:用人话解释

Google 这门课的最大优点是用直觉性的方式解释复杂概念,不需要高深数学。

什么是机器学习
传统编程:程序员写规则 → 计算机执行
机器学习:给数据 + 答案 → 计算机自己找规则

举例:垃圾邮件过滤
• 传统方法:程序员写「如果包含'免费领取'就是垃圾邮件」
• ML 方法:给 10 万封邮件(标注好是否垃圾),让模型自己学规律

三个核心概念

特征(Feature):输入给模型的信息
比如预测房价:面积、位置、楼层、建造年份 → 这些都是特征

标签(Label):你想预测的目标
比如预测房价:房价本身就是标签

模型(Model):学习特征→标签映射关系的数学函数

训练过程
1)给模型大量「特征+标签」的数据
2)模型随机初始化参数
3)用数据不断调整参数,让预测误差越来越小
4)误差足够小时,训练完成

过拟合 vs 欠拟合
• 过拟合:模型在训练数据上很好,但新数据上很差(记住了答案,没学到规律)
• 欠拟合:模型太简单,连训练数据都学不好
• 解决方法:调整模型复杂度,增加/减少数据

02 线性回归:最基础的 ML 模型

线性回归是最简单的 ML 模型,理解它能帮你理解所有 ML 模型的训练原理。

线性回归是什么
用一条直线(或超平面)来拟合数据。
公式:y = w₁x₁ + w₂x₂ + ... + b
• x:特征
• w:权重(模型要学习的参数)
• b:偏置
• y:预测值

损失函数:衡量预测有多差
最常用的是均方误差(MSE):
MSE = 平均((预测值 - 真实值)²)

训练的目标就是让 MSE 尽可能小。

梯度下降:怎么调整参数
想象你在山上,要找最低点(最小损失):
1)看当前位置的坡度(梯度)
2)往坡度下降的方向走一步
3)重复,直到到达谷底

学习率(Learning Rate)控制每步走多大:
• 太大:可能跨过最低点,来回震荡
• 太小:收敛太慢,训练时间很长

用 TensorFlow 做线性回归
import tensorflow as tf
import numpy as np

# 生成数据
X = np.array([1, 2, 3, 4, 5], dtype=float)
y = np.array([2, 4, 6, 8, 10], dtype=float) # y = 2x

# 创建模型
model = tf.keras.Sequential([tf.keras.layers.Dense(1)])
model.compile(optimizer='sgd', loss='mse')

# 训练
model.fit(X, y, epochs=100, verbose=0)

# 预测
print(model.predict([6])) # 应该接近 12

03 神经网络:从感知机到深度学习

神经网络是深度学习的基础,理解它能帮你理解 ChatGPT 等大模型的底层原理。

神经元:最基本的单元
一个神经元做三件事:
1)接收多个输入,乘以对应权重
2)把加权和加上偏置
3)通过激活函数,输出结果

为什么需要激活函数
没有激活函数,多层神经网络等价于一层线性变换,无法学习复杂模式。
常用激活函数:
• ReLU:max(0, x),最常用,计算简单
• Sigmoid:把输出压缩到 0-1,用于二分类输出层
• Softmax:多分类输出层,输出概率分布

反向传播:神经网络怎么学习
1)前向传播:输入 → 逐层计算 → 输出预测值
2)计算损失:预测值 vs 真实值
3)反向传播:从输出层往回,计算每个参数对损失的贡献(梯度)
4)更新参数:沿梯度反方向调整参数

用 Keras 搭建神经网络
model = tf.keras.Sequential([
tf.keras.layers.Dense(64, activation='relu', input_shape=(10,)),
tf.keras.layers.Dense(32, activation='relu'),
tf.keras.layers.Dense(1, activation='sigmoid') # 二分类
])

model.compile(
optimizer='adam',
loss='binary_crossentropy',
metrics=['accuracy']
)

model.summary() # 查看模型结构

04 实战练习:用 Google Colab 跑代码

Google ML 速成课的最大优势是有大量可以直接运行的 Colab 练习。

Google Colab 是什么
免费的云端 Jupyter Notebook,有免费 GPU,不需要本地安装任何东西。

开始使用
1)打开 colab.research.google.com
2)用 Google 账号登录
3)新建笔记本,或者打开课程提供的练习链接

课程配套练习清单
Google ML 速成课提供了以下 Colab 练习(在课程页面可以直接打开):
• 线性回归练习(预测加利福尼亚房价)
• 逻辑回归练习(二分类)
• 神经网络练习(手写数字识别)
• 特征工程练习

学习建议
不要只看视频,一定要动手做练习。遇到不懂的代码,复制给 ChatGPT 或 DeepSeek 问:「解释这段代码的作用」。

学完这门课能做什么
• 理解 ML 的基本原理,能看懂技术文章
• 用 TensorFlow/Keras 搭建简单模型
• 为学习更深入的课程(李宏毅 ML、fast.ai)打好基础
• 准备 Google 相关认证考试(TensorFlow Developer Certificate)

💡 想要更系统的 AI 学习路线?

去 ganhuo.ai 看完整路线图 →
🐑 小羊助手