台大李宏毅机器学习2021

news/2024/9/20 21:23:40

ML 2021 Spring (ntu.edu.tw)https://speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.htmlDiscussion:ML2021Spring-hw1 | Kaggle

Different types of functions。How to find a function?

Regression:The function outputs as a scalar.

Classification:Given options(classes),the function outputs the correct one.

 Structured Learning:create something with structure(image,documents) . 

1、Training

1.1、Model

1.2、Loss

                define loss from training data

                loss is a function of parametersL(b,w)

                How good a set of values is.

If y and \hat{y} are both probability distributions------->Cross-entropy.  

1.3、Optimization

                             find the best w^{*} b^{*} to get min L. 

                              way:Gradient Descent.

 在做机器学习需要自己设定的东西叫做hyperparameters(就是你自己决定的东西,人所设的东西不是机器自己找出来的)。

hyperparameters:learning rate、Batch size、

 Batch、Epoch:

(L表示所有数据N在一起计算时产生的Loss,L^{1}表示一个batch作为一个数据包计算时产生的Loss,根据L^{1}算出gradient,然后再更新参数......再取下一个batch计算,同理如下)

---所以我们并不是拿大L来计算Gradient,实际上我们是拿一个Batch算出来的L1L2L3来计算Gradient,把所有的batch都看过一次(也就是都计算一次)叫做一个Epoch,每一次更新参数叫做一次Update。-----所以Update和Epoch是不一样的东西,每次更新一次参数叫做一次Update,把所有的Batch都看过一遍叫做一个Epoch(所以一个Epoch并不是更新参数一次而是N/B)。

PS:在把所有的资料分成一个个Batch的时候,会做一件事情叫做Shuffle,Shuffle有很多不同的做法,但是常见的做法是:在每一个Epoch开始之前会分一次Batch,然后每一个Epoch的batch都不一样;所以哪一些数据在同一个Epoch里面,每一个Epoch都不一样的;叫做shuffle(洗牌)

 

 

 Rectified Linear  Unit(ReLu):两个ReLu和起来是一个hard sigmoid;

 

 https://speech.ee.ntu.edu.tw/~hylee/ml/ml2021-course-data/hw/Colab/Google_Colab_Tutorial.pdf

 

2、

 模型的弹性:

模型很复杂:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pgtn.cn/news/17727.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

python networkx绘制图

python networkx绘制图 1. 效果图2. 安装3. 源码参考这篇博客将介绍如何使用python,networkx绘制图。 1. 效果图 可调整点的大小,点是否有label,点的颜色 无label VS 点=50 VS 点=100 VS 点=200效果图如下: 2. 安装 pip install networkx3. 源码 # networkx绘制点图

不丢失精度的获取照片的Gps经纬度

不丢失精度的获取照片的Gps经纬度 1. 实际照片存储经纬度2. **用pyhton exifread读取**3. 用java metadata-extractor读取4. windows用 exiftool命令行读取参考查了超多的资料,发现照片的GPS信息是以rational64u 有理数的格式存储的。如经度、纬度度,在Exif中是以3个浮点数,…

Java对点、线、面生成栅格瓦片jpg,并渲染呈现

Java对点、线、面生成栅格瓦片jpg,并渲染呈现1. 效果图2. 原理2.1 面瓦片的生成2.2 线瓦片的生成2.3 多点瓦片的生成3. 源码参考这篇博客将介绍从前端HTML页面到后端预生成栅格瓦片jpg,并提供查询接口供前端html调用呈现效果图; 1. 效果图 …

Jupyter的使用方法

一、Jupyter新建python3文件的方法 1、打开桌面快捷方式,或者开始所有程序,找到anaconda文件夹,点击jupyter 2、点击new,选择python3 3、在1处输入代码,在2处点击运行 4、点击1处,在2处输入文件名字&#…

[vb+mo] visual baisc 6.0 基于mapobjects 2.4 开发的数字化校园电子地图

程序的源代码下载地址: https://docs.google.com/ 请安装VB6.0企业版(不是企业版运行会报错,因为缺少相应的控件)和ESRI MO2.4 程序的质量一般,因为时间仓促,主要是毕业设计时间仓促.希望大家多多改进.有什么问题可以发邮件欢迎交流. 程序的主窗口代码: 通用变量定义Private l…

Windows版本Anaconda安装教程

1、点击安装包,右键-以管理员身份运行安装文件,如图所示: 2、直接点击next即可 3、接着进入到许可协议的界面,这里点击I agree选项,也就是我同意的意思。 4、接着进入到用户选择的界面,选择all users选项&a…

Python 对图像进行base64编码及解码读取为numpy、opencv、matplot需要的格式

Python 对图像进行base64编码及解码读取为numpy、opencv、matplot需要的格式1. 效果图2. 源码参考这篇博客将介绍Python如何对图像进行base64编解码及读取为numpy、opencv、matplot需要的格式。 1. 效果图 原始图如下: base64转换为numpy数组效果图如下&#xff…

OpenCV使用 GrabCut 算法进行交互式前景提取

OpenCV使用 GrabCut 算法进行交互式前景提取 1. 效果图2. 源码参考这篇博客将介绍如何使用Python,OpenCV中的GrabCut 算法来提取图像中的前景,并为此创建一个交互式应用程序。 1. 效果图 官方示例——lena 原始图 VS grabcut前景设置 VS 前景抠图效果如下: 鼠标右键绘制矩…