★★★ 本文源自AlStudio社区精品项目,【点击此处】查看更多精品内容 >>>

【导读】关于机器学习的学习资料从经典书籍、免费公开课到开源项目应有尽有,可谓是太丰富啦,给学习者提供了极大的便利。但网上比比皆是的学习资料大部分都是英文材料,这可难倒了英语不好的学习者,单词不认识,理解不到位。小编不禁想问:就真的就没办法了嘛。其实也不尽然,中文还是有一些不错的学习资料的,像周志华老师的西瓜书,李航老师的统计学习方法等等都是相当经典的学习资料。今天的项目是一门中文经典视频课程–台大李宏毅的机器学习相关的配套学习资源,希望帮助大家入门机器学习!

李宏毅机器学习课程导航

『李宏毅课程-机器学习』课程链接:https://aistudio.baidu.com/aistudio/course/introduce/1978

课程项目一览:

作业1-PM2.5预测

这个作业是关于线性回归的作业,其要求如下:给定训练集train.csv,要求根据前9个小时的空气监测情况预测第10个小时的PM2.5含量。机器要判断function明天上午的PM2.5输出,你要提供给它一些资讯,它才能够猜出明天上午的PM2.5。你给他资讯可能是今天上的PM2.5、昨天上午的PM2.5等等。这是一个function,它吃我们给它过去PM2.5的资料,它输出的是预测未来的PM2.5。

作业2-年收入判断

这个作业主要是使用逻辑回归来判断一个人的年薪是否大于50k。
任务:二分类问题,判断一个人年薪是否超过50k,数据集:ADULT,由Barry Becker从1994年人口普查数据库中提取,按照((AGE>16) && (AGI>100) && (AFNLWGT>1) && (HRSWK>0))条件过滤后,保持数据的干净。

参考:https://archive.ics.uci.edu/ml/datasets/Adult

作业3-食物图片分类

这个作业主要是训练一个简单的CNN卷积神经网络,实现食物图片的分类。本次使用的数据集为food-11数据集,共有11类,包括Bread, Dairy product, Dessert, Egg, Fried food, Meat, Noodles/Pasta, Rice, Seafood, Soup, and Vegetable/Fruit。(面包,乳制品,甜点,鸡蛋,油炸食品,肉类,面条/意大利面,米饭,海鲜,汤,蔬菜/水果)下载 zip 档后解压缩会有三个资料夹,分别为training、validation 以及 testing。training 以及 validation 中的照片名称格式为 [类别]_[编号].jpg,例如 3_100.jpg 即为类别 3 的照片(编号不重要)

作业4-语句分类

这个作业是通过RNN实现文本情感分类(Text Sentiment Classification)输入是1个句子,输出是0(负面)或1(正面)。训练集:标注数据20万,无标注数据120万测试集:20万(无标注)一个句子(sentence)中有多个word,我们需要通过Word Embedding(我的其它文章里有介绍)用一个vector表示一个word, 然后使用RNN得到一个表示该sentence的vector。这里使用一种半监督学习方法:Self-Training(我的其它文章里有介绍)。使用有标签数据训练好模型,然后对无标签数据进行预测,并根据预测结果对无标签数据进行标注(“伪标签”)并继续训练模型。

作业5-迁移学习

这个作业的任务是迁移学习中的领域对抗性训练(Domain Adversarial Training)。Domain Adaptation是让模型可以在训练时只需要 A dataset label,不需要 B dataset label 的情况下提高 B dataset 的准确率。 (A dataset & task 接近 B dataset & task)也就是给定真实图片 & 标签以及大量的手绘图片,通过迁移学习设计一种方法使得模型可以预测出手绘图片的标签是什么。这次的任务是源数据: 真实照片,目标数据: 手画涂鸦。我们必须让model看过真实照片以及标签,尝试去预测手画涂鸦的标签是什么。

配套项目代码(一键运行)

上课笔记+难点讲解+代码实践

1. 〖李宏毅课程-机器学习〗作业1-PM2.5预测

2. 〖李宏毅课程-机器学习〗作业2-年收入判断

3. 〖李宏毅课程-机器学习〗作业3-食物图片分类

4. 〖李宏毅课程-机器学习〗作业4-语句分类

5. 〖李宏毅课程-机器学习〗作业5-迁移学习

配套数据集(含详细介绍)

1. 作业1-PM2.5预测

考点:数据处理、线性回归。

2. 作业2-年收入判断

考点:逻辑回归、模型生成。

3.作业3-食物图片分类

考点:卷积神经网络、图像分类。

4.作业4-语句分类

考点:循环神经网络、情感分析。

5.作业5-迁移学习

考点:领域对抗性训练

作者简介

作者:张不懂D ,欢迎互粉!
经历:上海科技大学研究生在读,零基础接触机器学习
开源不易,欢迎点赞 ❤ 和 Fork ,欢迎大家相互学习讨论

此文章为搬运
原项目链接

Logo

学大模型,用大模型上飞桨星河社区!每天8点V100G算力免费领!免费领取ERNIE 4.0 100w Token >>>

更多推荐