中文信息|2022语言与智能技术竞赛开赛

日前 , 聚焦自然语言处理领域的2022语言与智能技术竞赛正式启动 。 本次竞赛联手“千言”数据集开源项目 , 覆盖跨模态、知识驱动、可信学习等人工智能的前沿课题 , 发布新四大任务 , 并发布中文领域首个搜索知识对话数据集、首个面向实际应用场景的中文大规模段落检索数据集等多个重磅数据集 。
【中文信息|2022语言与智能技术竞赛开赛】语言与智能技术竞赛已连续举办4届 , 成为目前最热门的中文自然语言处理赛事之一 。 本次竞赛由中国中文信息学会和中国计算机学会联合主办 , 百度、中国中文信息学会评测工作委员会和中国计算机学会自然语言处理专委会承办 。
在上一届评测中 , 参赛队伍超过3500支 , 企业队伍占比约20% , 覆盖了互联网、通讯、金融、能源、航空航天等多个领域;高校队伍占比约50% , 覆盖了清华大学、北京大学、复旦大学、中国人民大学、慕尼黑工业大学、早稻田大学、爱丁堡大学等300多所国内外高校 。 评测累计收到有效提交结果1万多次 , 竞争激烈 。
2022年竞赛对赛题设置进一步升级 , 推出四大新任务:段落检索、知识对话、情感分析可解释性、视频语义理解 。 这四大任务赛道覆盖自然语言处理的前沿领域 , 反映了真实应用的需求 , 具有极高的学术和产业价值 。
本次语言与智能技术竞赛联手“千言”项目 , 首次公开多个最新中文数据集:来源于实际应用场景的大规模段落检索数据集DuReader_Retrival、领域开放的搜索知识对话数据集DuSINC、情感分析可解释数据集DuExplain、大规模视频语义理解数据集DuVUnderstanding 。 这些数据集具有很高的技术价值 , 将在本次评测期间 , 免费开放给参赛选手进行技术研究和探索 。 采访人员马爱平