版权声明:本文为博主原创文章遵循 版权协议,转载请附上原文出处链接和本声明 * 获取txt的文件内容 新建的默认格式 ,其它三种格式会乱码 * 读取PDF文字的内容 * 读取网页纯攵本内容用来存储索引方法*/ //設置不需要頁面的鏈接信息 //設置將不間斷空格由正規空格替代 //設置一系列空格由單一空格代替 * 处理附件方法 获嘚JSON数组