小米科技|2022年必须要了解的20个开源NLP 库( 三 )


20、scikit-learn
48.6k GitHub stars.
Scikit-learn(也称为 sklearn)是 Python 编程语言的免费软件机器学习库 。它具有各种分类、回归和聚类算法 , 包括支持向量机、随机森林、梯度提升、k-means 和 DBSCAN , 是建立在 Python 数值和科学库 NumPy 和 SciPy 之上的 。
21、Pandas
32.4 GitHub stars.
Pandas 是一个提供了操作表格数据的Python 包 。它已经成为在 Python 中进行实际的、真实的数据分析的基础模块 。它可以被称作最强大、最灵活的开源数据分析/操作工具 。
https://www.overfit.cn/post/a95c29726cba4e3aa969066fb7c80ad5
作者:Fabio Chiusano