谷歌AI看不懂网友评论，会错意高达30%，网友：你不懂我的梗( 二 ) Pine发自凹非寺量子位|公众号

说了这么多，数据集判别失误率这么高的原因也就显而易见了。
但与此同时，提高AI判别情绪的精确度也有了清晰的方向。
例如博主也在这篇文章中就给出了几条建议：
首先，在对评论贴标签时，得对他所处的文化背景有深刻地理解。以Reddit为例，要判断其评论的情绪色彩，要对美国的一些文化、政治理解透彻，并且还要能够迅速get到专属网站的“梗”；
其次，要测试标签对一些讽刺、习语、梗的判别是否正确，确保模型能够整整理解文本的意思；
最后，核查模型判断与我们真实判别，以做出反馈，更好地训练模型。
OneMoreThingAI大牛吴恩达曾发起过一项以数据为中心的人工智能运动。

文章图片
将人工智能从业者的重点从模型/算法开发转移到他们用于训练模型的数据质量上。吴恩达曾说：
数据是人工智能的食物。
用于训练数据的好坏对于一个模型也至关重要，在新兴的以数据为中心的AI方法中，数据的一致性至关重要。为了获得正确的结果，需要固定模型或代码并迭代地提高数据质量。
……
最后，你觉得在提高语言AI判别情绪这件事上，还有什么方法呢？
欢迎在留言区讨论~
参考链接：
[1]https://www.reddit.com/r/MachineLearning/comments/vye69k/30_of_googles_reddit_emotions_dataset_is/[2]https://www.surgehq.ai/blog/30-percent-of-googles-reddit-emotions-dataset-is-mislabeled[3]https://mitsloan.mit.edu/ideas-made-to-matter/why-its-time-data-centric-artificial-intelligence—完—
量子位QbitAI·头条号签约