怎样判断一个word 或者pdf文件内容是中文还是英文,使用tika获得文本

【怎样判断一个word 或者pdf文件内容是中文还是英文,使用tika获得文本】

怎样判断一个word 或者pdf文件内容是中文还是英文,使用tika获得文本

文章插图
如何判断word或pdf文件的内容是中文还是英文 , 如何通过tika获取文本 , 如何通过tika获取文本介绍:比如如何判断word或pdf文件的内容是中文还是英文 , 如何获取文本字符串str = tika 。用Tika解析tostring(新文件(strfile path));获得