谷歌AI看不懂网友评论,会错意高达30%,网友:你不懂我的梗( 二 )
说了这么多 , 数据集判别失误率这么高的原因也就显而易见了 。
但与此同时 , 提高AI判别情绪的精确度也有了清晰的方向 。
例如博主也在这篇文章中就给出了几条建议:
首先 , 在对评论贴标签时 , 得对他所处的文化背景有深刻地理解 。 以Reddit为例 , 要判断其评论的情绪色彩 , 要对美国的一些文化、政治理解透彻 , 并且还要能够迅速get到专属网站的“梗”;
其次 , 要测试标签对一些讽刺、习语、梗的判别是否正确 , 确保模型能够整整理解文本的意思;
最后 , 核查模型判断与我们真实判别 , 以做出反馈 , 更好地训练模型 。
OneMoreThingAI大牛吴恩达曾发起过一项以数据为中心的人工智能运动 。
文章图片
将人工智能从业者的重点从模型/算法开发转移到他们用于训练模型的数据质量上 。 吴恩达曾说:
数据是人工智能的食物 。
用于训练数据的好坏对于一个模型也至关重要 , 在新兴的以数据为中心的AI方法中 , 数据的一致性至关重要 。 为了获得正确的结果 , 需要固定模型或代码并迭代地提高数据质量 。
……
最后 , 你觉得在提高语言AI判别情绪这件事上 , 还有什么方法呢?
欢迎在留言区讨论~
参考链接:
[1]https://www.reddit.com/r/MachineLearning/comments/vye69k/30_of_googles_reddit_emotions_dataset_is/[2]https://www.surgehq.ai/blog/30-percent-of-googles-reddit-emotions-dataset-is-mislabeled[3]https://mitsloan.mit.edu/ideas-made-to-matter/why-its-time-data-centric-artificial-intelligence—完—
量子位QbitAI·头条号签约
- 空调|夏天空调开26度真的省电吗?快来看看
- 游戏版号|阿里巴巴:不懂复盘,一切都是白费功夫!
- 本文转自:中工网看 i 温暖你我能为 in 概念股 媒体矩阵 中工网客户端中工网微信公众...|看 i 温暖你我能为 in 概念股
- 本文转自:看看新闻上海近期持续高温|上海:电网安然度过首轮高温 加强监测保证运维安全
- c语言|鸿蒙装机2.4亿台后,谷歌突然宣布决定,外媒:来不及了
- 从上半年的手机市场就可以看出|荣耀magic5pro+或加入18gb内存版本
- 苹果iPhone大家都了解|降价之后的iphone13值得入手吗?看完你就明白了
- 一文看懂,数字技术如何对物流运输业进行赋能
- python自动化测试课程哪个好 朋友亲测的这个地方值得一看
- 铜器|看珍稀贝壳和古蜀人的“贝类世界”