PDF 转文本 API 提供了一种快速可靠的解决方案,将 PDF 文件转换为纯文本或文字。这个 API 允许用户从 PDF 文档中提取文本内容,非常适合文本分析、数据提取和文档处理等多种使用案例。
该 API 利用先进技术,准确地将 PDF 文件转换为文本,同时保留原始文档的格式和结构。生成的文本可以轻松操作和分析,为用户提供有价值的洞见和信息。
该 API 易于使用,可以集成到现有工作流中,消除手动数据输入的需要,节省时间和资源。该 API 旨在处理各种 PDF 文件,包括具有复杂布局和格式的文件,是多种应用程序中的多用途工具。
除了快速可靠,PDF 转文本 API 还安全且受保护,确保用户数据的隐私和安全。通过这个 API,企业和组织可以快速轻松地从 PDF 文件中提取文本,简化操作并获得宝贵的洞见。
传递公开可访问的 PDF URL,接收其中识别到的文本。
文本分析:此 API 可用于从 PDF 中提取文本并进行文本分析,如情感分析、关键词提取和主题建模。
数据提取:API 允许用户从 PDF 中提取数据,例如表格、列表和表单,以便用于电子表格和数据库。
文档处理:该 API 可用于将 PDF 转换为可编辑文本,使文档更易于操作和处理,以便用于各种目的。
电子书转换:该 API 可用于将 PDF 转换为纯文本,使创建电子书和其他数字内容变得更容易。
语言翻译:API 可从以不同语言书写的 PDF 中提取文本,使翻译文档以便于全球受众更容易。
除了 API 调用次数外,没有其他限制
要使用此端点,您必须上传一个PDF文件
PDF 提取器 - 端点功能
| 对象 | 描述 |
|---|---|
请求体 |
[必需] 文件二进制 |
{"text":"Lorem ipsum \nLorem ipsum dolor sit amet, consectetur adipiscing \nelit. Nunc ac faucibus odio. \nVestibulum neque massa, scelerisque sit amet ligula eu, congue molestie mi. Praesent ut\nvarius sem. Nullam at porttitor arcu, nec lacinia nisi. Ut ac dolor vitae odio interdum\ncondimentum. Vivamus dapibus sodales ex, vitae malesuada ipsum cursus\nconvallis. Maecenas sed egestas nulla, ac condimentum orci. Mauris diam felis,\nvulputate ac suscipit et, iaculis non est. Curabitur semper arcu ac ligula semper, nec luctus\nnisl blandit. Integer lacinia ante ac libero lobortis imperdiet. Nullam mollis convallis ipsum,\nac accumsan nunc vehicula vitae. Nulla eget justo in felis tristique fringilla. Morbi sit amet\ntortor quis risus auctor condimentum. Morbi in ullamcorper elit. Nulla iaculis tellus sit amet\nmauris tempus fringilla.\nMaecenas mauris lectus, lobortis et purus mattis, blandit dictum tellus.\n\uf0b7\nMaecenas non lorem quis tellus placerat varius. \n\uf0b7\nNulla facilisi. \n\uf0b7\nAenean congue fringilla justo ut aliquam. \n\uf0b7\nMauris id ex erat. Nunc vulputate neque vitae justo facilisis, non condimentum ante\nsagittis. \n\uf0b7\nMorbi viverra semper lorem nec molestie. \n\uf0b7\nMaecenas tincidunt est efficitur ligula euismod, sit amet ornare est vulputate.\nRow 1\nRow 2\nRow 3\nRow 4\n0\n2\n4\n6\n8\n10\n12\nColumn 1\nColumn 2\nColumn 3\nIn non mauris justo. Duis vehicula mi vel mi pretium, a viverra erat efficitur. Cras aliquam\nest ac eros varius, id iaculis dui auctor. Duis pretium neque ligula, et pulvinar mi placerat\net. Nulla nec nunc sit amet nunc posuere vestibulum. Ut id neque eget tortor mattis\ntristique. Donec ante est, blandit sit amet tristique vel, lacinia pulvinar arcu. Pellentesque\nscelerisque fermentum erat, id posuere justo pulvinar ut. Cras id eros sed enim aliquam\nlobortis. Sed lobortis nisl ut eros efficitur tincidunt. Cras justo mi, porttitor quis mattis vel,\nultricies ut purus. Ut facilisis et lacus eu cursus.\nIn eleifend velit vitae libero sollicitudin euismod. Fusce vitae vestibulum velit. Pellentesque\nvulputate lectus quis pellentesque commodo. Aliquam erat volutpat. Vestibulum in egestas\nvelit. Pellentesque fermentum nisl vitae fringilla venenatis. Etiam id mauris vitae orci\nmaximus ultricies. \nCras fringilla ipsum magna, in fringilla dui commodo \na.\nLorem ipsum\nLorem ipsum\nLorem ipsum\n1\nIn eleifend velit vitae libero sollicitudin euismod.\nLorem\n2\nCras fringilla ipsum magna, in fringilla dui commodo\na.\nIpsum\n3\nAliquam erat volutpat. \nLorem\n4\nFusce vitae vestibulum velit. \nLorem\n5\nEtiam vehicula luctus fermentum.\nIpsum\nEtiam vehicula luctus fermentum. In vel metus congue, pulvinar lectus vel, fermentum dui.\nMaecenas ante orci, egestas ut aliquet sit amet, sagittis a magna. Aliquam ante quam,\npellentesque ut dignissim quis, laoreet eget est. Aliquam erat volutpat. Class aptent taciti\nsociosqu ad litora torquent per conubia nostra, per inceptos himenaeos. Ut ullamcorper\njusto sapien, in cursus libero viverra eget. Vivamus auctor imperdiet urna, at pulvinar leo\nposuere laoreet. Suspendisse neque nisl, fringilla at iaculis scelerisque, ornare vel dolor. Ut\net pulvinar nunc. Pellentesque fringilla mollis efficitur. Nullam venenatis commodo\nimperdiet. Morbi velit neque, semper quis lorem quis, efficitur dignissim ipsum. Ut ac lorem\nsed turpis imperdiet eleifend sit amet id sapien.\nLorem ipsum dolor sit amet, consectetur adipiscing \nelit. \nNunc ac faucibus odio. Vestibulum neque massa, scelerisque sit amet ligula eu, congue\nmolestie mi. Praesent ut varius sem. Nullam at porttitor arcu, nec lacinia nisi. Ut ac dolor\nvitae odio interdum condimentum. Vivamus dapibus sodales ex, vitae malesuada ipsum\ncursus convallis. Maecenas sed egestas nulla, ac condimentum orci. Mauris diam felis,\nvulputate ac suscipit et, iaculis non est. Curabitur semper arcu ac ligula semper, nec luctus\nnisl blandit. Integer lacinia ante ac libero lobortis imperdiet. Nullam mollis convallis ipsum,\nac accumsan nunc vehicula vitae. Nulla eget justo in felis tristique fringilla. Morbi sit amet\ntortor quis risus auctor condimentum. Morbi in ullamcorper elit. Nulla iaculis tellus sit amet\nmauris tempus fringilla.\nMaecenas mauris lectus, lobortis et purus mattis, blandit \ndictum tellus. \nMaecenas non lorem quis tellus placerat varius. Nulla facilisi. Aenean congue fringilla justo\nut aliquam. Mauris id ex erat. Nunc vulputate neque vitae justo facilisis, non condimentum\nante sagittis. Morbi viverra semper lorem nec molestie. Maecenas tincidunt est efficitur\nligula euismod, sit amet ornare est vulputate.\nIn non mauris justo. Duis vehicula mi vel mi pretium, a viverra erat efficitur. Cras aliquam\nest ac eros varius, id iaculis dui auctor. Duis pretium neque ligula, et pulvinar mi placerat\net. Nulla nec nunc sit amet nunc posuere vestibulum. Ut id neque eget tortor mattis\ntristique. Donec ante est, blandit sit amet tristique vel, lacinia pulvinar arcu. Pellentesque\nscelerisque fermentum erat, id posuere justo pulvinar ut. Cras id eros sed enim aliquam\nlobortis. Sed lobortis nisl ut eros efficitur tincidunt. Cras justo mi, porttitor quis mattis vel,\nultricies ut purus. Ut facilisis et lacus eu cursus.\nIn eleifend velit vitae libero sollicitudin euismod. \nFusce vitae vestibulum velit. Pellentesque vulputate lectus quis pellentesque commodo.\nAliquam erat volutpat. Vestibulum in egestas velit. Pellentesque fermentum nisl vitae\nfringilla venenatis. Etiam id mauris vitae orci maximus ultricies. Cras fringilla ipsum\nmagna, in fringilla dui commodo a.\nEtiam vehicula luctus fermentum. In vel metus congue, pulvinar lectus vel, fermentum dui.\nMaecenas ante orci, egestas ut aliquet sit amet, sagittis a magna. Aliquam ante quam,\npellentesque ut dignissim quis, laoreet eget est. Aliquam erat volutpat. Class aptent taciti\nsociosqu ad litora torquent per conubia nostra, per inceptos himenaeos. Ut ullamcorper\njusto sapien, in cursus libero viverra eget. Vivamus auctor imperdiet urna, at pulvinar leo\nposuere laoreet. Suspendisse neque nisl, fringilla at iaculis scelerisque, ornare vel dolor. Ut\net pulvinar nunc. Pellentesque fringilla mollis efficitur. Nullam venenatis commodo\nimperdiet. Morbi velit neque, semper quis lorem quis, efficitur dignissim ipsum. Ut ac lorem\nsed turpis imperdiet eleifend sit amet id sapien.\n"}
curl --location 'https://zylalabs.com/api/1341/pdf+text+extractor+api/22014/pdf+extractor' \
--header 'Content-Type: application/x-www-form-urlencoded' \
--form 'image=@"FILE_PATH"'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
API返回从提供的PDF文件中提取的纯文本。输出结构为一个JSON对象,包含一个字符串数组,其中每个字符串代表PDF中一页的文本内容
响应中的主要字段是"pages_text_array",它保存一个字符串数组。每个字符串对应从PDF的特定页面提取的文本,允许用户按顺序访问内容
响应数据以JSON格式组织。它包含一个键“pages_text_array”,该键包含一个文本字符串数组。每个字符串代表从PDF的每一页提取的文本,保持页面的顺序
该API可以提取各种类型的信息,包括段落、列表、表格和表单。这使其适用于数据提取、文本分析和文档处理等应用
用户可以通过提供不同的PDF URL来自定义他们的请求但是API目前不支持用于过滤或修改提取过程的其他参数
典型的用例包括情感或关键字提取的文本分析、用于电子表格的数据提取、用于编辑的文档处理、电子书转换和PDF文档的语言翻译
该API利用先进技术确保准确从PDF中提取文本 它处理各种布局和格式 有助于保持原始文档内容的完整性
用户可以对提取的文本进行操作,以便用于各种应用,例如进行分析、创建报告或将文本集成到其他系统中 结构化的输出便于在编程环境中进行解析和处理
服务级别:
100%
响应时间:
1,945ms
服务级别:
100%
响应时间:
4,048ms
服务级别:
100%
响应时间:
3,208ms
服务级别:
100%
响应时间:
0ms
服务级别:
100%
响应时间:
1,113ms
服务级别:
100%
响应时间:
3,168ms
服务级别:
100%
响应时间:
1,429ms
服务级别:
100%
响应时间:
0ms
服务级别:
100%
响应时间:
1,812ms
服务级别:
100%
响应时间:
2,560ms
服务级别:
100%
响应时间:
841ms
服务级别:
100%
响应时间:
58ms
服务级别:
100%
响应时间:
258ms
服务级别:
100%
响应时间:
315ms
服务级别:
100%
响应时间:
287ms
服务级别:
100%
响应时间:
726ms
服务级别:
100%
响应时间:
2,741ms
服务级别:
100%
响应时间:
187ms
服务级别:
100%
响应时间:
309ms
服务级别:
100%
响应时间:
1,865ms