发布日期:2024-09-24招标截止: 2024-10-14项目工期:15-30 天项目预算:¥ 面议
项目类型:公开竞标项目项目地区:广东省项目分类:[ 应用软件开发 ]
【 项目内容 】
1、使用Python将txt、md、docx、pdf、xlsx、csv、png、jpg、jpeg 转化为可程序直接读取的文本和图片
2、将所有资料中的文本按照其内容分类,以txt的格式存储到本地,资料中的图片则存储到该分类的子文件夹下,并按照原本的资料结构,在txt中以绝对路径的形式存在
3、对于图片资料,需要对图片内容进行分类,其中的文字要识别为文本存储,格式和上面相同
4、对视频内容进行理解,以同样的格式存储到本地
5、原生开发,不能调用API接口实现
【联系我时,请说明是在 能客网 看到的】