模态|图片、文字、语音都能理解 这个AI平台是“全能”选手( 二 )