您可以使用开源实用程序,xpdf, 将pdf文件转换为平面文本文件,并像搜索其他文本文件一样进行搜索。不过,并入WordPress是另一件需要担心的事情。
我在Mac上使用它从公司的季度财务报表中提取数据。你可以在Mac OS X下安装,如果你有MacPorts 已安装。
port install xpdf
然后需要使用该实用程序
xpdf-pdftotext
将pdf文件转换为纯文本文件。
您可以简单地将结果作为变量存储在PHP中
$file_name = \'/usr/local/src/file1.pdf\';
// On Mac the utility is called xpdf-pdftotext, and pdftotext on Linux I believe
if (file_exists($file_name)) {
$file_contents = shell_exec("/opt/local/bin/xpdf-pdftotext $filename - 2>&1");
echo $file_contents;
}
如果要安装
xpdf
从源头上,其可在
website, 它同时提供Linux和Windows版本。
查看xpdf man pages 为了了解实用程序,他们为不同的应用程序提供了不同的工具。以下是pdftotext
公用事业
祝你好运。