GetTextFromPDF

返回指定容器字段中 PDF 文件中发现的文本。

格式 

GetTextFromPDF ( 容器 )

参数 

容器 - 任何返回 PDF 文件容器数据的表达式。

返回的数据类型 

文本

原始版本 

22.0

说明 

使用此函数从存储在容器字段中的 PDF 文件中获取文本。这对于以下方面非常有用:

  • 对存储的 PDF 文件的内容编制索引,以便在 FileMaker Pro 文件中搜索。

  • 通过从标准化的 PDF 表单或报告中返回特定文本来自动化数据输入。

  • 无需外部工具或手动复制和粘贴即可分析 PDF 文档中的文本。

注释 

  • 返回文本的质量取决于源 PDF 文件的质量和结构。字体、颜色、大小和精确布局等格式不会保留在返回的文本中。

  • 位图图像格式的文本,如 PNG 或 JPG,不会从 PDF 文件中返回。

  • 此函数在以下情况下返回 "?":

    • 容器字段为空,不包含 PDF 文件,或者未找到文本。

    • PDF 文件是扫描文档。

    • PDF 文件受密码保护或因任何原因无法读取。

示例 1 

GetTextFromPDF ( 表::容器 ) 当“表::容器”字段包含此页面的 PDF 文件时,返回如下所示的纯文本。

复制
Claris FileMaker Pro 帮助
参考>函数参考>容器函数>GetTextFromPDF
GetTextFromPDF
返回指定容器字段中 PDF 文件中发现的文本。
格式
...

示例 2 

在名为“合同”的表中,有一个存储合同 PDF 文件的容器字段“合同PDF”,名为 ContainsNDA 的计算字段设置为:

复制
Let (
    pdfText = GetTextFromPDF ( 合同::合同PDF ) ; 
    PatternCount ( pdfText ; "保密协议" ) > 0 
)

在“合同::合同PDF”中的 PDF 文件包含“保密协议”短语的每个记录中,ContainsNDA 字段将设置为 1(真)。要在不手动打开每个 PDF 文件的情况下快速查找包含特定短语“保密协议”的所有合同,请执行 ContainsNDA 字段等于 1 的查找。