谷歌AI看不懂网友评论,会错意高达30%,网友:你不懂我的梗( 二 )


说了这么多 , 数据集判别失误率这么高的原因也就显而易见了 。
但与此同时 , 提高AI判别情绪的精确度也有了清晰的方向 。
例如博主也在这篇文章中就给出了几条建议:
首先 , 在对评论贴标签时 , 得对他所处的文化背景有深刻地理解 。 以Reddit为例 , 要判断其评论的情绪色彩 , 要对美国的一些文化、政治理解透彻 , 并且还要能够迅速get到专属网站的“梗”;
其次 , 要测试标签对一些讽刺、习语、梗的判别是否正确 , 确保模型能够整整理解文本的意思;
最后 , 核查模型判断与我们真实判别 , 以做出反馈 , 更好地训练模型 。
OneMoreThingAI大牛吴恩达曾发起过一项以数据为中心的人工智能运动 。
谷歌AI看不懂网友评论,会错意高达30%,网友:你不懂我的梗
文章图片
将人工智能从业者的重点从模型/算法开发转移到他们用于训练模型的数据质量上 。 吴恩达曾说:
数据是人工智能的食物 。
用于训练数据的好坏对于一个模型也至关重要 , 在新兴的以数据为中心的AI方法中 , 数据的一致性至关重要 。 为了获得正确的结果 , 需要固定模型或代码并迭代地提高数据质量 。
……
最后 , 你觉得在提高语言AI判别情绪这件事上 , 还有什么方法呢?
欢迎在留言区讨论~
参考链接:
[1]https://www.reddit.com/r/MachineLearning/comments/vye69k/30_of_googles_reddit_emotions_dataset_is/[2]https://www.surgehq.ai/blog/30-percent-of-googles-reddit-emotions-dataset-is-mislabeled[3]https://mitsloan.mit.edu/ideas-made-to-matter/why-its-time-data-centric-artificial-intelligence—完—
量子位QbitAI·头条号签约