佐治亚理工学院硕士建议:2022年你应该掌握这些机器学习算法( 二 )


聚类算法可用于进行聚类分析 , 它是一项无监督学习任务 , 可以将数据分组到聚类中 。 与目标变量已知的监督学习不同 , 聚类分析中没有目标变量 。
聚类能够发现数据中的自然模式和趋势 。 k-means聚类和层次聚类是最常见的两种聚类算法 。
降维算法
数据降维算法是机器学习算法中的大家族 , 它的目标是将向量投影到低维空间 , 以达到可视化、分类等目的 。
佐治亚理工学院硕士建议:2022年你应该掌握这些机器学习算法
文章图片
降维技术在很多情况下都很有用:在数据集中有数百甚至数千个特征并且用户需要选择少数特征时 , 需要用到降维;当ML模型过度拟合数据也需要降维 , 这意味着用户需要减少输入特征的数量 。
目前已经存在大量的数据降维算法 , 可以从不同的维度进行分类 。 按照是否有使用样本的标签值 , 可以将降维算法分为有监督降维和无监督降维;按照降维算法使用的映射函数 , 可以将算法分为线性降维与非线性降维 。 其中 , 主成分分析PCA、线性判别分析LDA为线性降维 。
相似性算法
佐治亚理工学院硕士建议:2022年你应该掌握这些机器学习算法
文章图片
在机器学习中 , 我们经常需要知道个体间差异的大小 , 进而评价个体的相似性和类别 。 相似性算法是计算节点、数据点、文本对相似性的算法 , 如欧几里得距离 , 也有计算文本相似度的相似度算法 , 如Levenshtein算法 。
相似性算法主要包括:K近邻算法、欧几里得距离、余弦相似度、奇异值分解等 。 其中 , K近邻算法 , 即是给定一个训练数据集 , 对新的输入实例 , 在训练数据集中找到与该实例最邻近的K个实例 , 这K个实例的多数属于某个类 , 就把该输入实例分类到这个类中 。 欧几里得距离是欧几里得空间中两点间普通(即直线)距离 。 余弦相似度是通过计算两个向量的夹角余弦值来评估他们的相似度 。
https://towardsdatascience.com/all-machine-learning-algorithms-you-should-know-in-2022-db5b4ccdf32f
基于Python , 利用NVIDIATAOToolkit和Deepstream快速搭建车辆信息识别系统
NVIDIATAOToolkit是一个AI工具包 , 它提供了AI/DL框架的现成接口 , 能够更快地构建模型 , 而不需要编码 。
DeepStream是一个用于构建人工智能应用的流媒体分析工具包 。 它采用流式数据作为输入 , 并使用人工智能和计算机视觉理解环境 , 将像素转换为数据 。
DeepStreamSDK可用于构建视觉应用解决方案 , 用于智能城市中的交通和行人理解、医院中的健康和安全监控、零售中的自助检验和分析、制造厂中的组件缺陷检测等
12月14日19:30-21:00 , 本次分享摘要如下:
介绍TAOToolkit的最新特性;
介绍NVIDIADeepstream的最新特性;
利用TAOToolkit丰富的预训练模型库 , 快速训练模型;
直接利用TAOToolkit的预训练模型和Deepstream部署应用;