佐治亚理工学院硕士建议:2022年你应该掌握这些机器学习算法( 二 )
聚类算法可用于进行聚类分析 , 它是一项无监督学习任务 , 可以将数据分组到聚类中 。 与目标变量已知的监督学习不同 , 聚类分析中没有目标变量 。
聚类能够发现数据中的自然模式和趋势 。 k-means聚类和层次聚类是最常见的两种聚类算法 。
降维算法
数据降维算法是机器学习算法中的大家族 , 它的目标是将向量投影到低维空间 , 以达到可视化、分类等目的 。
文章图片
降维技术在很多情况下都很有用:在数据集中有数百甚至数千个特征并且用户需要选择少数特征时 , 需要用到降维;当ML模型过度拟合数据也需要降维 , 这意味着用户需要减少输入特征的数量 。
目前已经存在大量的数据降维算法 , 可以从不同的维度进行分类 。 按照是否有使用样本的标签值 , 可以将降维算法分为有监督降维和无监督降维;按照降维算法使用的映射函数 , 可以将算法分为线性降维与非线性降维 。 其中 , 主成分分析PCA、线性判别分析LDA为线性降维 。
相似性算法
文章图片
在机器学习中 , 我们经常需要知道个体间差异的大小 , 进而评价个体的相似性和类别 。 相似性算法是计算节点、数据点、文本对相似性的算法 , 如欧几里得距离 , 也有计算文本相似度的相似度算法 , 如Levenshtein算法 。
相似性算法主要包括:K近邻算法、欧几里得距离、余弦相似度、奇异值分解等 。 其中 , K近邻算法 , 即是给定一个训练数据集 , 对新的输入实例 , 在训练数据集中找到与该实例最邻近的K个实例 , 这K个实例的多数属于某个类 , 就把该输入实例分类到这个类中 。 欧几里得距离是欧几里得空间中两点间普通(即直线)距离 。 余弦相似度是通过计算两个向量的夹角余弦值来评估他们的相似度 。
https://towardsdatascience.com/all-machine-learning-algorithms-you-should-know-in-2022-db5b4ccdf32f
基于Python , 利用NVIDIATAOToolkit和Deepstream快速搭建车辆信息识别系统
NVIDIATAOToolkit是一个AI工具包 , 它提供了AI/DL框架的现成接口 , 能够更快地构建模型 , 而不需要编码 。
DeepStream是一个用于构建人工智能应用的流媒体分析工具包 。 它采用流式数据作为输入 , 并使用人工智能和计算机视觉理解环境 , 将像素转换为数据 。
DeepStreamSDK可用于构建视觉应用解决方案 , 用于智能城市中的交通和行人理解、医院中的健康和安全监控、零售中的自助检验和分析、制造厂中的组件缺陷检测等
12月14日19:30-21:00 , 本次分享摘要如下:
介绍TAOToolkit的最新特性;
介绍NVIDIADeepstream的最新特性;
利用TAOToolkit丰富的预训练模型库 , 快速训练模型;
直接利用TAOToolkit的预训练模型和Deepstream部署应用;
- 华为|硕士毕业入职华为上研所,待过两个部门,说一下自己在华为的亲身感受
- 麻省理工学院|当AI学会高数:解题、出题、评分样样都行
- 华为|人均年薪115万,比华为腾讯工资还要高?近一半的员工是硕士
- 科技厅|浙江新一批科特派出征 超八成为硕士博士
- 孟君|打败孟军,成为任正非第二任老婆,姚安娜生母为何又输给女硕士?
- 华为|工资高过华为腾讯,人均年薪115万,过半员工是硕士
- 国家电网|37岁的女硕士在互联网公司月薪1.6万,被降工资后,入职国家电网
- 广东以色列理工学院九项成果首秀2021创交会
- 想一夜暴富吗? 文章来源:瘾工厂 ID:ygc667 作者:瘾厂长 编辑:妮妮 人生最残...|想做春梦还是暴富梦?麻省理工学院做了个“造梦机器”!
- 微电子学院|上海大学凭什么获得集成电路科学与工程唯一的一级学科硕士点