远程连接数据世界的每一个人都对机器学习感到疑惑而不是单纯知道机器学习why not go one better并开始工作
if you're looking 跳进ML世界 但却不知道从何开始, 我已经策划了12个亲手学习项目 帮助启动您的行程这些项目范围从比较简单分类任务到自然语言处理和图像识别的复杂挑战不等。
vwin德赢娱乐官网或对机器学习实现感兴趣的中间编解码器,
查查我们其他讲解者文章机器学习模型,职业路径并基本机器学习工具.
we'll覆盖:
12大机器学习项目
分类项目
分类包括根据特征对预定义类或标签进行排序分类项目是新进机学习的好方法,因为它们帮助你通过现实世界问题理解基础概念三个机器学习项目
开工预测酒质量
Oincology-or wine科学为艺术分类提供趣味介绍UCI系统酒质量数据集可分红白酒
库中可使用 scit-learn或Tensorflow预测葡萄酒质量基于11物理化学特性,如酸性、硫酸和糖的存在学习如何理解特征重要性 并处理偏差数据集 通过现实世界数据集主任务分类,您也可以扩展项目运行回归分析预测酒质量评分
二叉树类识别
UCI叶数据集高超理解图像预处理和特征提取项目根据树叶形状和纹理研究树类的最佳分类方法
额外功劳使用自邻落叶或提取自有特征集增强原创数据集学习曲线比大多数初创者分类项目略高, 但你会学习如何创建更强健机器学习模型.
3级Exoplanet发现
越外位嵌入Caltech开普勒Explanet数据集提供独特的分类挑战学习如何检测外平面(太阳系外平面),分析通过NASA空间望远镜观察的光曲线
将挑战你寻找方法提高模型精度 通过应用高级时间序列分析顺序数据 并学习如何通过异常检测处理稀有事件项目需要更深入域知识研究, 同时也是一个展示你深入新主题领域并开发实用模型能力的机会
自然语言处理项目
自然语言处理交叉语言学和机器学习编译者对教机以新的实用方式理解、解释和生成人文三大有说服力NLP项目 跨行业应用
开工垃圾邮件检测
无垃圾邮件检测算法无法使用后台过滤自发消息UCI短信垃圾邮件收集数据集5 574封标注为垃圾邮件或火腿(非垃圾邮件)
Python自然语言工具箱或cit-learn库学习预处理文本、提取特征并运行预测模型学习处理偏差数据集的优秀项目 — — 现实世界商业场景中常见 — — 因为垃圾邮件只占真消息的微小百分比。
二叉情感分析
每天数以百万计的人通过产品评审或社交媒体文章表达在线观点
情感140数据集由一组斯坦福研究者发布 160万推文供你训练机器学习模型标签推文正面、负或中性,学习如何用文字解释人的情感,处理 sang语,并决策模棱两可或微调语句
学习使用词嵌入式和循环神经网络等技术,这些技术在许多NLP应用中占有特征刷新技巧全向导情感分析.
3级假新闻检测器
Google“假新闻检测”,你可能不感到意外地知道有多少主动研究项目存在来解决这个问题。视内容创建速度而定,识别偏差和误报特别困难
中位数假新闻数据集中位应用广受欢迎的机器学习库像TensorFlow处理大文本数据,理解嵌入内容,并应对创建模型的挑战,该模型可可靠理解规模微值
推荐项目
推荐系统或行业内RecSys讲法 强力许多最常用服务 日复一日使用系统试图优化和个性化经验 基于我们的偏好和交互机器学习项目具有挑战性,因为很难预测用户对噪声数据集喜欢什么
开工电影院
电影Lens数据集跨度2500万评分 遍历62,000电影学习如何使用Python库,如Surprise或LightFM构建推荐算法系统
产生强大的协作滤波基础 一种基于用户或项目相似性 提出建议技术这也是理解矩阵因子分解和用户嵌入等概念的好方法
二叉建设Goodread
Avid阅读器特别喜欢跳入此项目USDGoodread数据集富存用户书籍交互作用,近100万用户评分超过200万册书籍
建构阅读推荐系统将介绍内容过滤等概念,建议基于项目特征和用户偏好
3级餐厅评分
叶尔浦近700万餐厅评审数据集可用以建模推荐餐厅
学习如何处理文本数据、额外特征并理解解决棘手问题冷启动问题ML中,模型需要为新用户提供精确建议
计算机视觉项目
教机器看一览未来 机器可以解读分析视觉数据有兴趣更高级项目分析像素和模式, 有三个项目应用现实世界
开工面性表达式
Google面部表达式数据集内含156,000图像 由人手加注分类 各种情感
学习构建模型 识别并正确分类面部表达式 Python库,例如 OpenCV面部检测和Keras深入学习可多方向取此项目一个很好的实例是学习如何使用卷积神经网络实现实时视频处理人类情感
二叉流量分析
自驾驶车的允诺在ML新闻循环中居主导地位已有段时间你有没有想过算法为它提供动力
如果是,查查奥尔巴尼大学US-DETRAC数据集与10小时交通视频 从中国ython库使用像Tensorfrook对象检测API或YOLO最先进对象检测搭建ML系统实时检测分析车辆这个项目会沉浸于挑战概念中, 诸如反向检测技巧和跟踪算法, 你会从计算机视觉与城市规划交错处 带出一个令人印象深刻的组合项目
3级人类活动
中佛罗里达大学发布动作识别数据集超过13000视频跨101动作类别,包括编织、潜水、篮球和冲浪
委托你建模型 正确标注这些活动 通过时间序列分析学习处理视频数据3D神经网络a groject为更高级学习者研究通过机器学习识别人运动的具体复杂性
总结
从分类数据集和破译NLP文本情感到创建精确推荐系统并应对计算机视觉挑战,这12机学习项目为学习新技术提供多种方法,并用强组合项目展示技能
vwin德赢娱乐官网数据解析世界令你感兴趣 可你不知道从何开始探索机器Python课程?覆盖机器学习基础 通过实战项目 与专家导师, 并会给你一个很好的想法
可能你对下列文章感兴趣: